وظایف و مسئولیتهای اصلی:
توسعه و استقرار سیستمهای LLM و RAG
طراحی، پیادهسازی و بهینهسازی پایپلاینهای RAG
Deploy و مدیریت مدلهای LLM در محیط production (API serving، load balancing، scaling)
فاینتیون و آموزش مدلهای متنباز
به روز بودن در زمینه روشهای بهبود بازیابی متن و کار با RAPTOR, Self-RAG, RAGFlow
معماری نرمافزار و زیرساخت
طراحی معماری میکروسرویس برای سیستمهای LLM/RAG با تمرکز بر مقیاسپذیری و قابلیت اطمینان
پیادهسازی سیستمهای caching، queue management و async processing برای بهینهسازی latency
یکپارچهسازی با پایگاههای داده برداری
مانیتورینگ، لاگینگ و debugging سیستمهای production (Prometheus، Grafana، ELK Stack)
توانایی کار با git و استقرار مدلها با استفاده از Docker، Kubernetes و orchestration tools
GraphRAG و گرافهای دانش
طراحی و پیادهسازی GraphRAG برای کاربردهای چتبات، موتور جستجو، مدیریت دانش سازمانی
ساخت و بهروزرسانی گرافهای دانش از دادههای متنی: استخراج موجودیت و رابطه (NER/RE)، نرمالسازی گرهها
بهینهسازی Traversalها و مسیرهای پرسوجو (Cypher/SPARQL) برای بازیابی بلادرنگ در حلقهی RAG
تلفیق نتایج گراف با بازیابی برداری/کلمات کلیدی (fusion-in-decoder، reranking، hybrid scoring)
همکاری و نوآوری
همکاری نزدیک با تیمهای محصول، بکاند و دیتا برای یکپارچهسازی LLM/GraphRAG در محصولات واقعی
رصد مداوم آخرین دستاوردهای NLP، Graph ML و هوش چندوجهی و انتقال آنها به تولید
مستندسازی فنی، code review و mentoring اعضای تیم
مهارتها و صلاحیتهای ضروری
حداقل 2 سال تجربه عملی در LLM، RAG و گراف دانش
تسلط کامل بر Python و کتابخانههای NLP: LangChain، LlamaIndex، Hugging Face Transformers
درک قوی از فاینتیون LLM (LoRA/QLoRA، RLHF) و ارزیابی RAG (RAGAS، BLEU/ROUGE)
تجربه در طراحی و پیادهسازی معماری میکروسرویس و RESTful/GraphQL APIs
مسلط به Docker، Kubernetes و container orchestration
تجربه با CI/CD pipelines (GitLab CI، GitHub Actions، Jenkins)
آشنایی با ابزارهای مانیتورینگ و لاگینگ (Prometheus، Grafana، ELK Stack)
تجربه deploy مدلهای ML در production (TorchServe، TensorFlow Serving، FastAPI)
تجربه عملی با پایگاههای گراف (Neo4j، TigerGraph، Amazon Neptune) و زبانهای پرسوجو Cypher/SPARQL
آشنایی عمیق با پایگاههای برداری (Milvus، Weaviate، FAISS) و مدلهای Embedding (BERT، qwen)
تجربه با SQL/NoSQL databases (PostgreSQL، MongoDB، Redis)
مهارتهای ترجیحی
مدرک کارشناسی ارشد یا دکتری در علوم کامپیوتر، هوش مصنوعی یا رشتههای مرتبط
آشنایی با Graph ML (GNNها، Node2Vec/DeepWalk) و رتبهبندی مبتنی بر گراف (Personalized PageRank)
تجربه با Cloud platforms (AWS، GCP، Azure) و managed services
تجربه در RAG چندوجهی (متن + گراف + تصویر/ویدئو) و همخطسازی مودالها
آشنایی با Distributed computing و message queues (Kafka، RabbitMQ، Celery)
سابقه انتشار/مشارکت در جامعه NLP یا Graph ML (ACL، NeurIPS، arXiv، مخازن متنباز)