نشان کن
کد آگهی: KP6453016690

متخصص یادگیری ماشین | MLOps Engineer

متخصص یادگیری ماشین | MLOps Engineer - خودرو 45 | Khodro45
خودرو 45 | Khodro45
در تهران
در وبسایت ایران تلنت  (3 روز پیش)
اطلاعات شغل:
نوع همکاری:  تمام‌وقت
نیاز به سابقه:  حداقل 1 سال
متن کامل آگهی:
درباره نقش:

ما به دنبال یک مهندس MLOPS هستیم که می تواند مدل های AI را به ویژه LLMS و AII AI در محیط های دنیای واقعی مستقر ، بهینه سازی و حفظ کند. سرویس ها. Whisper یا Google گفتار API).

ایجاد و حفظ اتصالات جریان به LLM ها برای پاسخ های زنده و در زمان واقعی.

نظارت بر استفاده از GPU ، مصرف RAM و بارهای وظیفه را بهینه کنید. عملکرد سیستم پایدار.

مهارت ها و تجربه های مورد نیاز:

مهارت در کتابخانه های Python و Basic ML (Pytorch یا Tensorflow ، حداقل برای اجرای و پیکربندی). . HAVES:

تجربه در زمینه اتصال یا اتصالات شبکه به مدل ها.

آشنایی با تکنیک های کمیت یا بهینه سازی LLM.
About the Role:

We are seeking an MLOps Engineer who can deploy, optimize, and maintain AI models particularly LLMs and Voice AI in real-world environments.
The main focus of this role is on deploying language models (such as DeepSeek, OpenAI API), working with local GPUs or dedicated servers, and managing real-time communication with language and voice-to-text services.

Responsibilities:

Work with APIs of large language models (OpenAI, DeepSeek, and similar), including managing API keys, rate limits, and stable connections.

Install, configure, and deploy LLMs on GPUs (e.g., DeepSeek, Mistral, Llama, etc.).

Implement and integrate Voice-to-Text solutions (such as Whisper or Google Speech API).

Create and maintain streaming connections to LLMs for live and real-time responses.

Monitor GPU usage, RAM consumption, and task loads, and optimize system performance.

Write scripts for simple automation of deployment or monitoring (using Python or Bash).

Collaborate closely with the backend and model teams to ensure smooth and stable system performance.

Required Skills and Experience:

Proficiency in Python and basic ML libraries (PyTorch or TensorFlow, at least for execution and configuration).

Hands-on experience deploying LLMs on GPUs.

Familiarity with APIs such as OpenAI, DeepSeek, and similar services.

Good understanding of GPU operations (nvidia-smi, memory usage, batching, etc.).

Experience with lightweight monitoring tools such as Prometheus or Grafana (basic level).

Ability to work in Linux environments and familiarity with Docker for simple deployments.

Knowledge of Voice-to-Text frameworks such as Whisper, Vosk, or SpeechRecognition.

Nice to Haves:

Experience with streaming or WebSocket connections to models.

Familiarity with LLM quantization or optimization techniques.

Interest in inference optimization and latency reduction.

این آگهی از وبسایت ایران تلنت پیدا شده، با زدن دکمه‌ی تماس با کارفرما، به وبسایت ایران تلنت برین و از اون‌جا برای این شغل اقدام کنین.

هشدار
توجه داشته باشید که دریافت هزینه از کارجو برای استخدام با هر عنوانی غیرقانونی است. در صورت مواجهه با موارد مشکوک،‌ با کلیک بر روی «گزارش مشکل آگهی» به ما در پیگیری تخلفات کمک کنید.
گزارش مشکل آگهی
تماس با کارفرما
این آگهی رو برای دیگران بفرست
نشان کن
گزارش مشکل آگهی
پنج‌شنبه 25 مهر 1404، ساعت 01:53