ورودی: فایل fasta حاوی contigهای اسمبلی شده با حداقل طول 200bp (حدود 5 میلیون contigs) خروجی: نوع آنزیم کد شده توسط هر کانتیک به همراه توالی آن به فرمت fasta 1)در ابتدا فایل حاوی کانتیگ ها به 6 فریم ترجمه شود. (بصورت دستی و با کد پایتون یا R انجام شود چون کدها هم برای ارائه لازم است) 2) سپس 6فریم بدست امده(توالی پروتئینی) با دیتابیس non-redundant protein NCBI بصورت اتوماتیک(بااستفاده از API به سرور NCBI( هم ردیف شوند. براساس بالاترین score bit و بیشترین coverage ،صحیح ترین توالی پروتئینی بین 6 فریم ترجمه شده، انتخاب شود. (برای تعیین پروتین اصلی حتما باید یه کد پایتون یا R نوشته شود ) خروجی باید فایل fasta باشد که در توضیح هر توالی منتخب، نام کانتیگ و آنزیم مربوطه ذکر شود با پایتون یا R زمان کمی دارم دو روز
این آگهی از وبسایت کافه پروژه پیدا شده، با زدن دکمهی تماس با کارفرما، به وبسایت کافه پروژه برین و از اونجا برای این شغل اقدام کنین.