یک مهندس قابلیت اطمینان سایت (sre) نقشی اساسی در حصول اطمینان از اینکه خدمات و زیرساخت های سازمان بسیار در دسترس، مقیاس پذیر و کارآمد هستند، ایفا می کند. این موقعیت اغلب شامل ترکیبی از وظایف توسعه، عملیات و عیبیابی است.
قابلیت اطمینان و در دسترس بودن سیستم: اطمینان از دسترسی و قابلیت اطمینان بالای خدمات و زیرساختها. این شامل نظارت فعال، پاسخ حادثه، و تجزیه و تحلیل پس از مرگ برای جلوگیری از تکرار حوادث می شود.
مدیریت عملکرد: نظارت و بهینه سازی عملکرد سیستم برای دستیابی به اهداف سطح خدمات (slos) و توافقات سطح خدمات (slas). این امر مستلزم درک و مدیریت ظرفیت و مقیاس پذیری خدمات است.
مدیریت و واکنش حوادث: منجر به پاسخگویی به قطعی سیستم و مسائل مربوط به عملکرد، از جمله وظایف حین تماس می شود. توسعه ابزارهای اتوماسیون برای کمک به حل سریع حوادث و جلوگیری از تکرار آنها.
اتوماسیون و ابزارسازی: طراحی و پیاده سازی ابزارها و چارچوب های اتوماسیون برای کاهش کارهای عملیاتی دستی. این میتواند شامل اسکریپتهایی برای استقرار، نظارت و مدیریت زیرساخت باشد.
همکاری متقابل: همکاری نزدیک با تیمهای توسعه برای طراحی و پیادهسازی سیستمهای مقیاسپذیر، قابل اعتماد و کارآمد. این شامل ارائه ورودی در مورد تصمیمات معماری، بهینه سازی استفاده از منابع، و اطمینان از انعطاف پذیری سیستم است.
بهبود مستمر: تجزیه و تحلیل مداوم فرآیندها و سیستم های فعلی برای فرصت های بهبود. بهترین شیوهها را برای قابلیت اطمینان و در دسترس بودن سیستم اجرا کنید.
بازیابی و پشتیبانگیری از بلایا: برنامههای بازیابی بلایا را توسعه دهید و حفظ کنید، از جمله آزمایشهای منظم برای اطمینان از انعطافپذیری سیستم.
اسناد: مستندات دقیق معماری سیستم، پیکربندیها، فرآیندها و سوابق خدمات برای اطمینان از اینکه دانش در تیم به اشتراک گذاشته می شود و در دسترس است.
نیازها / مهارت ها
آموزش: a مدرک لیسانس در علوم کامپیوتر، مهندسی، یا یک رشته مرتبط، یا تجربه عملی معادل.
تجربه: تجربه اثبات شده در نقش مهندسی قابلیت اطمینان سایت یا موارد مشابه، با پیشینه قوی در توسعه نرم افزار و مدیریت سیستم.
مهارت های فنی :
- مهارت در زبان های برنامه نویسی.
- تجربه با خدمات ابر و ابزارهای هماهنگ سازی کانتینر (kubernetes، docker).
- درک قوی از اصول و پروتکل های شبکه.
- تجربه با یکپارچه سازی و استقرار مداوم (ci/cd) شیوه ها.
مهارت های حل مشکل: توانایی عیب یابی و حل مسائل پیچیده فنی تحت فشار.
مهارت های ارتباطی: کلامی عالی و مهارت های ارتباطی نوشتاری، با توانایی انتقال موثر مفاهیم فنی به ذینفعان غیر فنی.
کار تیمی: توانایی کار به طور مشترک در یک تیم متقابل کارکردی و تعامل موثر با توسعه دهندگان، تیم های عملیاتی و مدیریت.
مزایای شغلی
وام
بیمه سلامت
اتاق بازی
تنقلات
صبحانه< br>ناهار
بسته ها و هدایای مناسب
کمک هزینه های آموزشی
فضای استراحت
A Site Reliability Engineer (SRE) plays a pivotal role in ensuring that an organization's IT services and infrastructure are highly available, scalable, and efficient. This position often involves a blend of development, operations, and troubleshooting tasks.
Requirements:
Job Benefits:
این آگهی از وبسایت ایران تلنت پیدا شده، با زدن دکمهی تماس با کارفرما، به وبسایت ایران تلنت برین و از اونجا برای این شغل اقدام کنین.