نشان کن
کد آگهی: KP7074648901

تبدیل هوشمند فایل‌های PDF به فرمت JSON با Google Cloud AI

در فارس
در وبسایت کارلنسر  (2 هفته پیش)
دورکاری
اطلاعات شغل:
امکان دورکاری و کار در منزل: دارد
نوع همکاری:  پروژه‌ای
مهارت‌های مورد نیاز:
برنامه نویسی
json
ai
متخصص هوش مصنوعی
گوگل آنالیتیکس
cloud computing
python
data analysis
کدنویسی
بازه حقوق:  از 6,000,000 تا 12,000,000 تومان
نحوه پرداخت:  پروژه‌ای
متن کامل آگهی:
خلاصه پروژه: هدف این پروژه، استخراج دقیق و ساختاریافته محتوای کامل کتاب‌های درسی فارسی از فایل‌های PDF و تبدیل آن‌ها به فرمت JSON است. محتوای کتاب‌ها شامل متون فارسی، تصاویر، جداول، فرمول‌های ریاضی و علمی، و بخش‌های : کار درکلاس ، فعالیت ، تمرین و ... است. انتظار می‌رود این فرآیند با دقت بالا و به صورت ساختاریافته برای هر کتاب، فصل به فصل انجام شود 2. فناوری‌های مورد استفاده (الزامی): پروژه باید با استفاده از قوی‌ترین و جدیدترین مدل‌های هوش مصنوعی گوگل انجام شود. رویکرد ترکیبی زیر الزامی است: • Google Document AI: برای استخراج دقیق و ساختاریافته محتوا از اسناد. این سرویس به عنوان هسته اصلی پروژه، باید برای موارد زیر استفاده شود: o Document OCR Processor: برای تشخیص متن و ساختار کلی (پاراگراف‌ها، عنوان‌ها، لیست‌ها). o Table Parser Processor: برای شناسایی و استخراج دقیق داده‌ها از جداول به صورت سطر و ستون. • مدل Gemini 2.5 Pro: برای پردازش محتوای چندوجهی مانند تصاویر و فرمول‌ها. از این مدل برای تبدیل فرمول‌های ریاضی به فرمت LaTeX و تولید توضیحات (Caption) برای تصاویر استفاده خواهد شد. پالایش و ساختاردهی نهایی خروجی به فرمت JSON. 3. خروجی مورد انتظار فرمت JSON * خروجی نهایی باید برای هر فصل از کتاب یک فایل JSON مجزا باشد که ساختاری جامع و یکپارچه داشته باشد. * هر فایل JSON باید شامل محتوای صفحه به صفحه باشد که تمامی المان‌ها (متن، جدول، تصویر، فرمول) در آن به صورت ساختاریافته و قابل استفاده قرار گرفته باشند. * ساختار JSON باید به گونه‌ای باشد که به سادگی قابل استفاده در برنامه‌های کاربردی باشد. 4. الزامات و انتظارات: • دقت بالا: استخراج متن فارسی، جداول و فرمول‌ها باید با بالاترین دقت ممکن انجام شود. • حفظ ساختار: خروجی JSON باید ساختار اصلی کتاب (فصل‌ها، صفحات، تیترها، پاراگراف‌ها) را به درستی منعکس کند. • قابلیت مقیاس‌پذیری: راهکار ارائه شده باید قابلیت پردازش تعداد زیادی فایل PDF را داشته باشد

این آگهی از وبسایت کارلنسر پیدا شده، با زدن دکمه‌ی تماس با کارفرما، به وبسایت کارلنسر برین و از اون‌جا برای این شغل اقدام کنین.

هشدار
توجه داشته باشید که دریافت هزینه از کارجو برای استخدام با هر عنوانی غیرقانونی است. در صورت مواجهه با موارد مشکوک،‌ با کلیک بر روی «گزارش مشکل آگهی» به ما در پیگیری تخلفات کمک کنید.
گزارش مشکل آگهی
تماس با کارفرما
این آگهی رو برای دیگران بفرست
نشان کن
گزارش مشکل آگهی
شنبه 2 شهریور 1404، ساعت 10:47