نقش ها و مسئولیت ها
• طراحی و حفظ خوشه های محاسباتی مقیاس پذیر ، محور AI محور برای پشتیبانی از بارهای کاری شرکت و مراکز داده با راندمان و عملکرد بالا.
• طراحی و بهره برداری از زیرساخت های مرکز داده تحمل گسل ، تضمین در دسترس بودن بالا ، افزونگی و استراتژی های عدم موفقیت برای مهندسی های Mission-Cracinition (Mission-Cramitions ". چرخه چرخه مدل AI ، اطمینان از کارآیی عملیاتی و حفظ قابلیت اطمینان خدمات.
• خودکار سازی تهیه زیرساخت ها با استفاده از زیرساخت ها به عنوان کد (IAC) ، سیستم عامل های ابری خصوصی و محیط های کانتینر شده برای تقویت چابکی و کاهش تلاش دستی. بهینه سازی.
• مدیریت و بهینه سازی محیط های مجازی ، از جمله ابر خصوصی ، سیستم عامل ها و سیستم عامل های ارکستر کانتینر در سراسر شرکت. هزینه-کارآیی.
• همکاری با برنامه های برنامه ریزی و تحویل زیرساخت برای اطمینان از اجرای راه حل یکپارچه و انتقال به تیم های عملیاتی.
• ارائه ورودی به معماری شرکت و برنامه ریزی ظرفیت سیستم آینده ، پشتیبانی از استراتژی های گسترش مرکز داده ها و تداوم تجارت
• مدیریت عملیات و SLAS خدمات مرکز داده ها ، از جمله عملکرد شبکه و شبکه TAPITATION TAPIATION TOAGE TUT TOUGATION TUTE TUT TAPIATION TOAGOURATION TUTE TUTE TUTE TUTE TOADIATION TAPIATION WARTITORATION WARTITY TAPIATION WARTITY WARTITY WARTITY TAPIATE با استراتژی های اصلی مرکز داده ها و استانداردهای معماری و نظارت بر اجرای پروژه های زیرساختی IT مرتبط در مناطق اختصاص یافته اختلالات.
• برای بررسی عملکرد پس از عملیات سیستم های زنده و انجام گزارش های هفتگی به مدیریت ارشد در معیارهای عملیاتی و پیشرفت پروژه.
• ارتباط با ذینفعان مشاغل در مناطق اختصاص یافته برای گرفتن الزامات زیرساخت و ارائه خدمات متناسب با آن. در مورد روند فناوری و تغییرات فرآیند کسب و کار به روز شوید ، عملیات را تطبیق دهید ، و اعضای تیم و شرکای تیم را راهنمایی کنید. رمزگذاری.
• برای مدیریت پیچیدگی های تعامل بین بسیاری از فناوری ها و خدمات
الزامات شغلی
آموزش
• مدرک لیسانس در فناوری اطلاعات یا مرتبط
• حداقل 5 سال تجربه در زمینه عملیات مرکز داده ؛ با تجربه در نظارت/ مدیریت دیگران
• تجربه کار در یک سازمان متوسط تا سرمایه گذاری
تجربه در:
o عملیات و مدیریت مرکز داده ها
o ادغام سیستم ها و هماهنگی
o مدیریت پروژه
o این زیرساخت و خدمات معماری ONTERSURATURES و DATHIMENISIONIZIONISTION & SERVICIONATIONS و CLOUD MEDICUSTRUTURE
o devops/ sera serabs/ sera serabs/ sera serabs and sera serabs/ sera serabs/ sera sists and sera sists and sera serabs/ sera serabs/ sera serabs/ sera serabs/ sera sists and sera serabs
o devops/ sera serabs/ sera sists sist مدیریت
o امنیت و انطباق
o راه حل های بومی ابر
o اصول زیرساخت های زیرساخت
- To design and maintain scalable, AI-driven compute clusters to support enterprise workloads and data centers with high efficiency and performance.
- To design and operate fault-tolerant data center infrastructure, ensuring high availability, redundancy, and failover strategies for mission-critical systems.
- To implement and manage MLOps frameworks and Site Reliability Engineering (SRE) principles to streamline AI model lifecycle, ensure operational efficiency, and maintain service reliability.
- To automate infrastructure provisioning using Infrastructure-as-Code (IaC), private cloud platforms, and containerized environments to enhance agility and reduce manual effort.
- To leverage software-defined infrastructure (SDN, SDS, SDC) for dynamic resource allocation, scalability, and workload optimization.
- To manage and optimize virtualized environments, including private cloud, operating systems, and container orchestration platforms across the enterprise.
- To oversee security, compliance, and backup operations to ensure enterprise-grade data protection, regulatory adherence, and disaster recovery readiness.
- To lead managed services initiatives, including database infrastructure and internal services, to enhance performance, uptime, and cost-efficiency.
- To collaborate with Infrastructure Planning and Delivery functions to ensure seamless solution implementation and handover to operational teams.
- To provide input to enterprise architecture and future system capacity planning, supporting data center expansion strategies and business continuity.
- To manage the operation and SLAs of Data Center services, including collaboration with the Network Group and CT teams to ensure network stability and performance.
- To ensure alignment with core data center strategies and architectural standards and oversee the execution of related IT infrastructure projects in assigned regions.
- To monitor data center OPEX/Capex if applicable, prepare business cases, and manage outsourced vendor contracts, ensuring cost-effectiveness and adherence to quality standards.
- To act as the escalation point for regional DC operations, remaining on-call 24/7 for critical incidents and service disruptions.
- To review the post-implementation performance of live systems and conduct weekly reporting to senior management on operational metrics and project progress.
- To liaise with business stakeholders in assigned regions to capture infrastructure requirements and deliver tailored IT services accordingly.
- To ensure timely and compliant delivery of procured equipment, verifying quality and alignment with purchase orders and technical specifications.
- To stay updated on technology trends and business process changes, adapt operations, and guide team members and partners accordingly.
- To balance complex technological interdependencies and manage competing demands to deliver optimal 24/7 service to internal customers
- To provide infrastructure for future needs bearing in mind latest developments like containirazation, AI automation tools and so on,
- To ensure enterprise-grade security for data centers, including access control, hardening and encryption.
- To manage the complexities of the interaction between the multitude of technologies and services
Requirements:
Education
- • Bachelor's degree in Information Technology or related fields.
Experience
- At least 5 years of experience in the data centre operations area, with experience in supervising/managing others.
- Experience working in a medium-to-enterprise organization.
Experience in:
- Data center operations and management.
- Systems integration and coordination.
- Project management.
- IT Infrastructure and service architecture.
- Virtualization and cloud infrastructure.
- DevOps/SRE solutions and methodologies.
- Managed services and database administration.
- Security and compliance.
- Cloud native solutions.
- AI infrastructure fundamentals.