پروژه من آنالیز دیتای سیگنال صوتی لایو از میکروفون سیستم هست که باید بتونه با استخراج دیتای MFCC و Pitch و داشتن رفرنس از یک صدا، بتونه تشخیص بده صدای گوینده فعلی همون صدا هست یا نه
کاربردش در سیستم دستیار صوتی هست
دستیار صوتی متن هایی که llm جنریت میکنه رو میخونه، صدای رفرنس هم همین صدای تولید شده با هوش مصنوعی هست
نیازه که هر صدایی که صدای دستیار صوتی نیست و شامل speech هست شناسایی بشه و در صورتی که نویز و صدای محیط نبود و بعنوان صدای مورد قبول شناسایی بشه و دستیار صوتی رو متوقف (interrupt) بکنه
نیازه که این کار صرفا با سیگنال صوتی انجام بشه نهایتا یک مدل خیلی ساده چون قراره عینا در swift و ios/macos پیاده سازی بشه
چیزی که من از شما میخوام کد پایتون این ماجرا هست، تبدیل به کد سوییفت رو خودم انجام میدم
https://minhdo.ece.illinois.edu/teaching/speaker_recognition/
https://se.mathworks.com/help/audio/ug/speaker-identification-using-pitch-and-mfcc.html
این آگهی از وبسایت کارلنسر پیدا شده، با زدن دکمهی تماس با کارفرما، به وبسایت کارلنسر برین و از اونجا برای این شغل اقدام کنین.
هشدار
توجه داشته باشید که دریافت هزینه از کارجو برای استخدام با هر عنوانی غیرقانونی است. در صورت مواجهه با موارد مشکوک، با کلیک بر روی «گزارش مشکل آگهی» به ما در پیگیری تخلفات کمک کنید.