سلام
سیستم کامل جداسازی صدای خواننده با CNN سبک و بهینهسازی SFLA
یک کد پایتون مربوط به پردازش صوت (جداسازی صوت vocal از non vocal) دارم و می خواهم ایرادات کد برطرف شود و کد کامل همراه با فایل های خروجی نهایی در اختیار من قرار گیرد. در صورتی که فردی امکان بهبود کد را هم داشته باشد که نتایج بهتری بدست بیاید بهتر است.
لازم است که کد به طور کامل روی دیتاست MIR-1K آموزش داده شود و از داده های نمونه استفاده نشود.
این موارد را هم در نظر بگیرید که فکر کنم در کد قرار داده ام ولی اگر وجود ندارد قرار دهید تا گزارش های صحیح و کاملی تولید شود.
The MIR-1K dataset is partitioned with 70% for training, 15% for validation, and 15% for testing. Training employs stratified sampling to maintain class balance. Data augmentation techniques include:
1. Random time shifting (±50ms)
2. Gain variation (±6dB)
3. Additive noise with SNR 20-30dB
III-H. Evaluation Methodology
III-H.1. Objective Metrics
We evaluate separation quality using established metrics from the SiSEC evaluation campaign:
1. Source-to-Distortion Ratio (SDR): Overall separation quality
2. . Source-to-Interference Ratio (SIR): Suppression of other sources
3. Source-to-Artifact Ratio (SAR): Artifacts introduced by separation
4. Image-to-Spatial distortion Ratio (ISR): Spatial distortion (for stereo)
III-H.2. Computational Metrics
1. Model Size: Number of parameters and memory footprint
2. Inference Speed: Frames processed per second
3. Training Time: Time to convergence
4. Energy Efficiency: Estimated power consumption
III-H.3. Statistical Validation
Results are validated using:
• 5-fold cross-validation
• Bootstrapped confidence intervals (95%)
• Statistical significance testing (paired t-tests)
این آگهی از وبسایت کارلنسر پیدا شده، با زدن دکمهی تماس با کارفرما، به وبسایت کارلنسر برین و از اونجا برای این شغل اقدام کنین.
هشدار
توجه داشته باشید که دریافت هزینه از کارجو برای استخدام با هر عنوانی غیرقانونی است. در صورت مواجهه با موارد مشکوک، با کلیک بر روی «گزارش مشکل آگهی» به ما در پیگیری تخلفات کمک کنید.