نیازمند طراحی سازوکاری دقیق و پایدار برای استخراج متن از کتابها و مقالات PDF هستیم. هدف ما این است که هر فایل PDF (حتی شامل متون فارسی و عربی، شماره صفحه، پاورقی و سرصفحه) بتواند بهصورت خودکار و با دقت 100٪ به متن استاندارد تبدیل شود.
✅ الزامات پروژه:
توانایی طراحی و پیادهسازی OCR پیشرفته برای زبانهای فارسی و عربی
جداسازی و تشخیص دقیق:
متن اصلی
سرصفحه و پاصفحه
پاورقی و شمارههای آن
امکان پردازش دستهای (Batch Processing) برای چندین فایل همزمان
خروجی در فرمتهای متنی استاندارد (TXT / DOCX / JSON)
سازگاری با کتابهای اسکنشده و کیفیتهای مختلف PDF
این آگهی از وبسایت پونیشا پیدا شده، با زدن دکمهی تماس با کارفرما، به وبسایت پونیشا برین و از اونجا برای این شغل اقدام کنین.
هشدار
توجه داشته باشید که دریافت هزینه از کارجو برای استخدام با هر عنوانی غیرقانونی است. در صورت مواجهه با موارد مشکوک، با کلیک بر روی «گزارش مشکل آگهی» به ما در پیگیری تخلفات کمک کنید.