متن کامل آگهی:
عنوان پروژه:
توضیحات فنی پروژه:
ما به دنبال یک فریلنسر یا تیم متخصص در بیوانفورماتیک و توسعه نرمافزار هستیم تا یک پلتفرم وببنیاد برای OMICSCARE پیادهسازی کند. این سیستم باید قابلیتهای کلیدی Franklin (genoox.com) را شبیهسازی کند، از جمله پردازش خودکار واریانتها از فایلهای VCF/BAM، اعمال قوانین ACMG/AMP 2015 (با بهروزرسانیهای ClinGen)، محاسبه CNV/MSI، و تولید گزارشهای بالینی. تمرکز روی یک rule engine قوی برای classification واریانتها (Pathogenic, Likely Pathogenic, VUS, Likely Benign, Benign) بر اساس ترکیب قوانین با سطوح قدرت (Very Strong: PVS, Strong: PS, Moderate: PM, Supporting: PP, Benign: BA/BS/BP).
اجزای فنی کلیدی:
ورودی و پردازش دادهها:
پشتیبانی از آپلود VCF (تک/چند نمونهای) با استفاده از کتابخانههایی مانند PyVCF یا htslib.
نرمالسازی واریانتها با HGVS notation (e.g., CDH1:c.671G>T) با ابزارهایی مانند pyhgvs یا VariantValidator.
ادغام پایپلاین آنالیز اولیه (توسط ما فراهم میشود): Alignment با BWA-MEM، Variant Calling با GATK/FreeBayes، Annotation با VEP/ANNOVAR. فریلنسر باید خروجی JSON/VCF را parse کند و به engine ACMG پاس دهد.
موتور ACMG Rule Engine (بخش اصلی):
پیادهسازی ~28 قانون ACMG/AMP به صورت rule-based system (e.g., if/else logic یا rule engine مانند PyKE/Drools در Python).
هر قانون با وزن مشخص: e.g., PVS1 (Very Strong: nonsense/frameshift در ژن LoF-sensitive)، PM2 (Moderate: absent در gnomAD)، PP3 (Supporting: damaging پیشبینی با CADD >20, REVEL >0.7, SIFT/PolyPhen2).
جمعبندی خودکار بر اساس ترکیب قوانین:
Pathogenic: ≥1 Very Strong + ≥1 Moderate, یا ≥2 Strong.
Likely Pathogenic: 1 Very Strong + 1 Supporting, یا ≥3 Moderate.
Benign: BA1 (allele frequency >0.05 در gnomAD) یا ≥2 Strong Benign.
VUS: عدم تطابق با دستههای بالا.
استفاده از ابزارهای open-source برای پایه:
InterVar (GitHub: WGLab/InterVar) برای اجرای اتوماتیک ACMG روی VCF.
GenOtoScope (open-source tool برای automation ACMG criteria).
vaRHC (R package برای semi-automation در ژنهای سرطانی، قابل ادغام با Python via rpy2).
VarCards2 یا AnFiSA برای دیتابیس و refinement.
خروجی engine: JSON با فیلدهای "rules_triggered" (آرایه قوانین فعال e.g., ["PVS1", "PP3"]), "classification", "evidence" (با دادههای خام مانند gnomad_af, clinvar_status, cadd_score).
ماژولهای اضافی:
CNV/MSI: ادغام CNVkit/ExomeDepth برای CNV calling، MSIsensor2 برای MSI scoring. خروجی ادغامشده در ACMG (e.g., PS2 برای de novo CNV).
اتصال API به دیتابیسهای خارجی:
ClinVar API (برای clinical significance).
gnomAD API (برای allele frequency).
dbSNP/OMIM/COSMIC via Entrez API یا pyentrez.
Computational predictors: CADD/REVEL via API یا local scoring.
مثال endpoint API (با FastAPI):
POST /classify: ورودی {"variant": "CDH1:c.671G>T", "annotations": {...}} → خروجی JSON classification.
GET /evidence/{variant_id}: بازگشت شواهد با لینکهای خارجی.
پایگاه داده و ذخیرهسازی:
PostgreSQL (با SQLAlchemy/ORM) برای مدلهای relational: جدول Variants (با فیلدهای hgvs, gene, consequence, frequency)، Patients (clinical notes, pedigree JSON)، Classifications (rules, evidence).
پشتیبانی از indexing برای جستجوی سریع (e.g., full-text search روی gene/variant).
یا MongoDB برای دادههای unstructured مانند raw VCF.
فرانتاند و UI/UX:
React/Next.js با کامپوننتهای Material-UI یا Ant Design برای داشبورد physician-friendly.
ویژگیها:
Visualization: طیف ACMG (slider Benign-to-Pathogenic با highlight classification).
Interactive rules list (چکباکس برای manual override قوانین).
Pedigree viewer (با کتابخانه مانند react-family-tree یا dagre).
Report generator: تبدیل به PDF/HTML با pdfmake یا html2pdf.js، شامل variant details, classification, recommendations.
امنیت: JWT authentication، HIPAA-like compliance (encryption برای patient data).
DevOps و تست:
Containerization با Docker (برای reproducibility pipeline).
Deployment: روی AWS/GCP/VPS با CI/CD (GitHub Actions).
تست: Unit tests برای rule engine (e.g., pytest با sample VCFها)، integration tests برای API.
عملکرد: Handling >1000 variants/session، با caching (Redis) برای API calls.
نیازمندیهای فنی فریلنسر:
تسلط به Python (برای backend/rule engine) و JavaScript (برای frontend).
تجربه در بیوانفورماتیک: parsing VCF/HGVS، کار با ابزارهای GATK/VEP/CNVTools.
آشنایی با ACMG implementation (ترجیحاً با ابزارهای open-source مانند InterVar/GenOtoScope).
تجربه rule-based systems و API integration (REST/GraphQL).
امتیاز مثبت: پروژههای قبلی در genomics/precision medicine، دانش ML برای refinement (e.g., pathogenicity calculators مانند ClinGen).