بهعنوان مهندس هوش مصنوعی در تیم ما، مسئول توسعه و بهینهسازی سرویسهای مبتنی بر مدلهای زبانی بزرگ خواهید بود؛ سرویسهایی که عملکرد دقیق و پایدارشان در محصول واقعی حیاتی است.
شما در کنار یک تیم باهوش، یادگیرنده و نتیجهمحور روی حل چالشهای جدی در مقیاس عملیاتی کار میکنید و اثر مستقیم کارتان را در تجربه کاربران خواهید دید.
مسئولیتها
- توسعه و نگهداری سرویسهای مبتنی بر LLM (استنتاج / بهروزرسانی مدلها) روی On-Prem GPU Cluster
- طراحی و پیادهسازی زنجیرههای Retrieval-Augmented Generation
- بهینهسازی کارایی مدلها برای بهبود سرعت و مصرف GPU:
- Smart Batching / Caching / Quantization / LoRA / PEFT
- استقرار با Triton / TensorRT / ONNX Runtime
- طراحی و توسعه پایپلاین داده و آموزش (نسخهبندی داده و مدل، پایش کیفیت پاسخ و مدیریت Drift)
- استقرار سرویسها با Docker و راهاندازی Monitoring/Logging (Prometheus، Grafana و ابزارهای مشابه)
- تست، پروفایلینگ و مستندسازی دقیق برای عملکرد پایدار در محیط Production
- مشارکت در Design Review و Code Review و بهاشتراکگذاری دانش در تیم
شرایط احراز
- تسلط به Python و PyTorch / Transformers
- تجربه عملی در کار با LLM:
- Inference و دستکم یکی از موارد: Fine-tuning / LoRA / PEFT / RAG
- آشنایی کاربردی با GPU/CUDA
- تسلط به Git، Docker، امنیت API و CI/CD
- تجربه با ابزارهای زنجیرهسازی مدلها (LangChain / LangGraph و اتصال Promptها، حافظه و APIهای خارجی)
- مهارت در Prompt Engineering و ارزیابی و بهبود کیفیت پاسخها
- کدنویسی تمیز، ماژولار، مستند و تستپذیر