ما در «مرکز تحقیقات هوش مصنوعی پارت» مشتاقیم تا جهت موقعیت شغلی «متخصص ارشد هوش مصنوعی»، در حوزه پردازش گفتار با همکاری باانگیزه، مسئولیتپذیر و علاقهمند به یادگیری همراه باشیم. اگر شرایط زیر را دارید، از شما دعوت میکنیم با پیوستن به ما، آغازگر مسیری شگفتانگیز باشید.
شرح کلی موقعیت شغلی :
شما در این نقش روی طراحی، توسعه و بهبود مدلهای پیشرفته پردازش گفتار شامل بازشناسی و تحلیل گفتار ، سنتز گفتار و احراز هویت صوتی کار خواهید کرد. بسته به سطح تجربه، مسئولیتهای شما میتواند از پیادهسازی و تحقیق مدلهای جدید تا رهبری فنی پروژهها و هدایت تیم گسترده باشد.
مسئولیتها :
- طراحی، توسعه و بهینهسازی مدلهای پردازش گفتار (ASR، TTS، SV)
- بررسی، پیادهسازی و ارزیابی معماریهای مدرن مانند Conformer، Transformer، RNN-T و مدلهای مبتنی بر Attention
- تحلیل و آمادهسازی دادههای صوتی، استخراج ویژگیها و توسعه ابزارهای مرتبط
- مشارکت در تحقیق و توسعه روشهای نوآورانه برای ارتقای کیفیت مدلها
- همکاری با تیمهای MLOps برای استقرار مدلها در مقیاس بزرگ
- طراحی آزمایشها، تحلیل خطا و مستندسازی نتایج
- (برای سطح ارشد) هدایت فنی پروژهها، منتورینگ اعضای تیم و مشارکت در برنامهریزیهای کلان و Roadmap تحقیقاتی
مهارتهای الزامی (مشترک برای هر دو سطح) :
- تسلط مناسب بر مفاهیم یادگیری ماشین، یادگیری عمیق و هوش مصنوعی
- مهارت خوب در Python
- تسلط بر یکی از فریمورکهای PyTorch یا TensorFlow
- آشنایی با OOP
- آشنایی با Git و لینوکس
- روحیه کار تیمی، تعهد، نظم و علاقهمندی به یادگیری
- خلاقیت در ارائه راهکارهای نو
مهارتهای امتیازی (برای هر دو سطح – با انتظار بالاتر برای سطح ارشد) :
- آشنایی با مبانی پردازش سیگنال صوت و گفتار (MFCC، Filterbank، VAD و …)
- تجربه استفاده از مدلهای عمیق در حوزه صوت
- آشنایی با CTC، Encoder-Decoder، Transducer و مدلهای End-to-End
- آشنایی با i-vector، x-vector، d-vector برای احراز هویت صوتی
- تجربه کار با مدلهای Self-Supervised مانند Wav2Vec2، HuBERT یا مدلهای Whisper-style
- تجربه استقرار مدلها (ONNX Runtime، Triton، FastAPI و …)
- آشنایی با مدلهای پردازش متن
- آشنایی با LLMها و مدلهای generative
- آشنایی با ML pipelines و ابزارهای MLOps
- تجربه کار در مقیاس کلان داده
سایر توانمندی ها :
- تجربه در سیستمهای real-time یا low-latency
- آشنایی با کاربردهای مشترک صوت و متن مانند Voice Bots یا QA صوتی
- توانایی مستندسازی و ارائه تحلیلهای فنی
- (برای سطح ارشد) تجربه رهبری فنی یا هدایت یک پروژه/تیم