ما در سیشمی به دنبال همکاری با یک برنامهنویس توانمند هستیم که در زمینه *استخراج اطلاعات از وبسایتها (web scraping) و *ساخت خزندههای خودکار (crawler) مهارت کافی داشته باشد. پروژه شامل جمعآوری دقیق، ساختاریافته و بهروز اطلاعات از مجموعهای از وبسایتهای هدف است.
مسئولیتها:
* طراحی و توسعه crawler برای جمعآوری دادههای خاص از سایتها
* شناسایی ساختار صفحات HTML و استخراج دادهها با دقت بالا
* مدیریت و بهینهسازی زمان اجرا، پایایی و دقت استخراج
* دور زدن محدودیتهای سایت (rate limit، captcha، login) در صورت نیاز
* ذخیره و ساختاردهی دادهها در قالب CSV، Excel، JSON یا پایگاهداده
* مستندسازی کد و تحویل تمیز و قابلنگهداری
مهارتها و توانمندیهای ضروری:
زبان برنامهنویسی:
* تسلط کامل به **Python**
ابزارها و کتابخانهها:
* تسلط به **BeautifulSoup**
* تسلط به **Scrapy**
* تسلط به **Selenium** (برای سایتهای داینامیک)
* آشنایی با **Requests، LXML، aiohttp**
* آشنایی با **Playwright** (مزیت محسوب میشود)
مهارتهای فنی:
* آشنایی با ساختار HTML، DOM و CSS Selectors
* توانایی استفاده از **XPath** برای استخراج داده دقیق
* آشنایی با **Regex** (عبارات باقاعده) برای فیلتر و پاکسازی دادهها
* تسلط به ذخیرهسازی و پردازش دادهها در فرمتهای CSV، JSON، Excel
* آشنایی با پایگاهدادههای **MongoDB، PostgreSQL، MySQL**
* آشنایی با **Git** برای کنترل نسخه و کار تیمی
* توانایی مدیریت پروژههای scraping با **schedulerها مثل cronjob** یا **Celery**
* آشنایی با مفاهیم **multi-threading / async/ queueing** برای scraping سریعتر
* آشنایی با محیطهای مجازی مثل virtualenv و poetry
* توانایی کار با Docker و کانتینرسازی (مزیت محسوب میشود)
پیوستن به خانواده سیشمی چه مزایایی دارد؟
فرصت همکاری در پروژههای چالشبرانگیز و نوآورانه.
محیط کاری پویا و تیمی باانگیزه و حرفهای.
امکان یادگیری و رشد حرفهای در کنار افراد متخصص.
عقد قرارداد همکاری تمام وقت و انجام فعالیت ها به صورت دورکاری
برگزاری دورهمیهای دوستانه و حرفهای در اعیاد و جشن ها
پرداخت به موقع حقوق و مزایا، بدیهیترین حق شما در این مجموعه خواهد بود و ما از آن به عنوان یک مزیت یاد نمیکنیم.