مهارتهای ضروری:
• تسلط عملی به Python برای تحلیل داده و مدلسازی
(Pandas, NumPy, SciPy, Scikit-learn)
• توانایی کار با دادههای متنی و پردازش زبان طبیعی (NLP) شامل:
- o Tokenization، Normalization، Lemmatization
- Text Classification، Topic Modeling، Clustering
- Sentiment Analysis
• تجربه پیادهسازی الگوریتمهای یادگیری ماشین از جمله:
- Classification: Logistic Regression, Random Forest, XGBoost
- Clustering: K-Means, DBSCAN, Hierarchical
- Dimensionality Reduction: PCA, UMAP
- o Regression و Time Series Forecasting
• تسلط به SQL
توانایی مصورسازی داده و گزارشدهی:
o Matplotlib / Seaborn / Plotly
o ساخت داشبورد تحلیلی
• تجربه کار با پایگاههای داده مختلف:
- Relational: PostgreSQL, MySQL
- NoSQL: MongoDB, Elasticsearch
- آشنایی با Data Warehouseها
• توانایی طراحی و پیادهسازی Pipelineهای داده:
- Data Ingestion
- Cleaning & Validation
- Feature Engineering
- Storage
• تجربه کار با دادههای حجیم و لاگهای سیستم:
- Log Analysis
- Session Analysis
- Event Tracking
• مهارتهای ترجیحی (مزیت محسوب میشود):
• تجربه کار با مدلهای زبانی بزرگ (LLMs):
- Prompt Engineering
- Fine-tuning سبک (LoRA / QLoRA)
- Embedding-based Search
- RAG Systems
• آشنایی با سیستمهای پردازش داده در مقیاس بالا:
- Apache Spark / Dask
- Message Queues (Kafka, RabbitMQ)
• تجربه پیادهسازی سیستمهای توصیهگر یا تحلیل رفتار کاربر
• آشنایی با MLOps و استقرار مدل:
- MLflow
- Docker
- Triton
- CI/CD برای مدلها
• آشنایی با Elasticsearch برای جستجوی متنی و تحلیل لاگ
مهارتهای فردی
تفکر تحلیلی و حل مسئله
دقت بالا در کار با داده
توانایی ارائه نتایج به زبان ساده برای تیمهای غیرفنی
روحیه یادگیری و بهروز بودن
توانایی کار تیمی و مسئولیتپذیری