ما در تیم هوش مصنوعی به دنبال یک متخصص توانمند و با تجربه در حوزه پردازش صوت و گفتار هستیم. در این موقعیت، تمرکز اصلی بر توسعه سامانههای تشخیص خودکار گفتار (ASR) و تحلیل پیشرفتهی سیگنالهای صوتی در شرایط متنوع خواهد بود. این نقش مناسب کسانی است که در مواجهه با صداهای نویزی، محیطهای غیرایدهآل و تحلیل صوتی با رویکردهای یادگیری ماشین و یادگیری عمیق، تجربه عملی دارند.
مسئولیتها:
- طراحی و پیادهسازی سامانههای ASR برای استخراج متن از فایلهای صوتی در شرایط مختلف (از جمله صداهای محیطی و نویزی).
- تحلیل ویژگیهای صوتی و استخراج اطلاعات رفتاری یا احساسی از سیگنالهای گفتار.
- مشارکت در طراحی معماری سیستمهای صوتی در حوزههای امنیتی و جرمیابی دیجیتال.
- همکاری با تیمهای تحقیق و توسعه جهت بهینهسازی و ادغام ماژولهای صوتی در محصولات.
- مستندسازی کامل مراحل توسعه و ارزیابی مدلها.
مهارتهای ضروری:
تجربه عملی در طراحی، پیادهسازی یا سفارشیسازی مدلهای ASR با استفاده از ابزارهایی مانند Kaldi، ESPnet، Whisper، Wav2Vec 2.0، NeMo و غیره.
تسلط به مفاهیم کلیدی در پردازش سیگنال صوتی مانند VAD، Spectrogram، MFCC، و تبدیلهای فرکانسی.
تجربه کار با زبان Python و کتابخانههای PyTorch، TensorFlow و HuggingFace.
آشنایی با مجموعهدادههای صوتی متداول مانند LibriSpeech، Common Voice، VoxCeleb.
توانایی ارزیابی و بهبود دقت سیستمهای تشخیص گفتار در محیطهای واقعی و چالشبرانگیز.
مهارتهای مزیتی:
آشنایی با تکنیکهای تقویت صدا Noise Reduction، Denoising و Speech Enhancement
آشنایی با تشخیص گوینده (Speaker Identification/Verification).
مهارتهای عمومی:
مهارت در کار تیمی و تعامل مؤثر با تیمهای بینرشتهای.
توانایی حل مسائل پیچیده و ارائه راهحلهای قابل اجرا.
مسئولیتپذیری، دقت بالا و علاقهمندی به توسعه سیستمهای کاربردی و دقیق.
مزایای شغلی:
پرداخت حقوق بصورت منظم
کمک هزینه سفر
صبحانه و ناهار
امکانات ورزشی
بیمه
وام
نکات مهم:
محل شرکت در منطقه تهرانپارس میباشد.
همکاری به صورت حضوری و تمام وقت مد نظر میباشد.
امکان همکاری به صورت امریه سربازی نیز فراهم میباشد.