**موقعیت شغلی: توسعهدهنده Full-Stack جهت ساخت چتبات هوشمند مبتنی بر دانش (Knowledge-Driven Chatbot)**
ما در حال ساخت یک چتبات پیشرفته هستیم که **با استخراج هوشمند دادههای مرتبط از دیتابیس داخلی**، پاسخهای دقیق و مبتنی بر دانش اختصاصی ارائه میدهد. به دنبال توسعهدهندهای با مهارتهای زیر هستیم:
---
### **نیازمندیهای فنی پروژه:**
#### **1. طراحی و پیادهسازی دیتابیس بهینه (Backend):**
- **انتخاب تکنولوژی دیتابیس:**
- استفاده از **PostgreSQL** با قابلیت **Full-Text Search** (TSVECTOR/TSQUERY) یا **Elasticsearch** برای جستجوی سریع و معنایی.
- در صورت نیاز به اسکیل بالا: **MongoDB** با قابلیت **Atlas Search** یا **FAISS** برای جستجوی برداری (Vector Search).
- **طراحی ساختار داده:**
- ایجاد جداول/کالکشنهای بهینه برای ذخیرهسازی:
- `knowledge_base` (شامل فیلدهای: content, keywords, embeddings, metadata).
- `context_relations` (برای ارتباطات مفهومی بین دادهها با وزندهی).
- پیادهسازی **Chunking** دادهها به بلوکهای معنایی با استفاده از الگوریتمهایی مانند **Text Splitting** یا **Semantic Chunking**.
#### **2. استخراج هوشمند دادههای مرتبط (NLP Pipeline):**
- **پردازش سوال کاربر:**
- **توکنایز کردن** و **استخراج کلمات کلیدی** با کتابخانههایی مانند **NLTK** یا **spaCy**.
- **ایجاد Embedding** سوال با مدلهای متراکم نظیر **Sentence-BERT** یا **OpenAI Embeddings**.
- **جستجوی معنایی:**
- ترکیب **جستجوی لغوی** (TF-IDF/BM25) و **جستجوی برداری** (Cosine Similarity) برای یافتن بهترین نتایج.
- استفاده از **Hybrid Search** در Elasticsearch یا **pgvector** در PostgreSQL.
- اولویتدهی به دادهها بر اساس **مرتبطترین متادیتا** (مثال: تاریخ انتشار، منبع، امتیاز اعتبار).
#### **3. یکپارچهسازی با مدل زبانی (LLM Integration):**
- **طراحی سیستم Prompt Engineering:**
- ساخت تمپلیت پویا برای ترکیب سوال کاربر + دادههای استخراجشده (مثال:
```
"با استفاده از اطلاعات زیر پاسخ دهید: [DATA_CHUNKS]. سوال کاربر: [USER_QUESTION]"
```
- استفاده از **LangChain** یا **LlamaIndex** برای مدیریت Context Window و بهینهسازی توکنها.
- **انتخاب مدل:**
- استفاده از مدلهای متن-باز (مثل **Llama-3**, **Mistral**) یا سرویسهای ابری (مثل **OpenAI GPT-4**, **Anthropic Claude**).
#### **4. معماری سرویس (Backend Development):**
- **فریمورکها:**
- پیادهسازی API با **FastAPI** یا **Django REST Framework** برای تاخیر کم.
- مدیریت صف درخواستها با **Celery** یا **RabbitMQ**.
- **بهینهسازی عملکرد:**
- کشینگ نتایج جستجو با **Redis** برای کاهش بار دیتابیس.
- پیادهسازی **Rate Limiting** و **Auto-Scaling**.
#### **5. رابط کاربری (Frontend):**
- **توسعه چت باکس Real-Time:**
- استفاده از **React** با **WebSocket** (Socket.io) یا **Next.js**.
- نمایش منابع استخراجشده به کاربر در قالب **Citation** یا هایلایت متن.
---
### **مهارتهای مورد نیاز توسعهدهنده:**
- تسلط به **Python** و کتابخانههای NLP (Hugging Face, spaCy, NLTK).
- تجربه در طراحی دیتابیسهای **Vector-Based** و **Hybrid Search**.
- آشنایی با **LLM Orchestration** (LangChain, Haystack).
- مهارت در توسعه APIهای پرسرعت (**FastAPI**, **GraphQL**).
- دانش معماریهای **Microservices** و **Caching Strategies**.
- آشنایی با **Docker** و **Kubernetes** برای استقرار.
---
**ارزشهای پروژه:**
- ساخت سیستمی که **دقت پاسخها را تا 70% نسبت به چتباتهای عمومی افزایش میدهد**.
- بهینهسازی زمان پاسخگویی به زیر **1.5 ثانیه** حتی با حجم دادههای بالا.
---
اگر علاقهمند به حل چالشهای پیچیده در حوزه NLP و سیستمهای مبتنی بر دانش هستید، منتظر پیشنهادات شما هستیم!
این آگهی از وبسایت پونیشا پیدا شده، با زدن دکمهی تماس با کارفرما، به وبسایت پونیشا برین و از اونجا برای این شغل اقدام کنین.
هشدار
توجه داشته باشید که دریافت هزینه از کارجو برای استخدام با هر عنوانی غیرقانونی است. در صورت مواجهه با موارد مشکوک، با کلیک بر روی «گزارش مشکل آگهی» به ما در پیگیری تخلفات کمک کنید.