آموزش یادگیری تقویتی (Reinforcement Learning)

دوره آموزش یادگیری تقویتی چیست؟ زمینه‌هایی مثل علم داده، هوش مصنوعی و یادگیری ماشین در حال حاضر محبوبیت زیادی را به خود اختصاص داده‌اند. چراکه با استفاده از این علوم می‌توان سیستم‌های هوشمند و یادگیرنده طراحی کرد و کارها را با سرعت و دقت بیشتری انجام داد. یادگیری تقویتی یا Reinforcement Learning برای ارتباط دادن یادگیری ماشین و شبکه‌های عمیق با دنیای صنعت کاربرد دارد. با یادگیری تقویتی می‌توان یک ماشین را برای انجام یک بازی به نحوی آموزش داد که در برابر انسان به پیروزی برسد. یادگیری تقویتی ارتباط بین هوش مصنوعی با صنعت را برقرار می‌کند. کاربرد اصلی یادگیری تقویتی در برنامه‌ریزی ربات‌ها و ماشین‌هایی است که به تولید کارخانه‌ها یا مدیریت انبار کمک می‌کنند. این ربات‌ها با یادگیری تقویتی تمام سناریوهای احتمالی زمان کار را فراگرفته و در زمان اتفاق افتادن هرکدام از حالات، واکنشی متناسب با آن از خود نشان می‌دهند. سیستم‌های خودآموز در دنیای امروز نقش بسیار ویژه‌ای دارند و شرکت‌هایی مثل آمازون یا اپل بر اساس این سیستم‌ها کار می‌کنند. هدف از یادگیری دوره آموزش یادگیری تقویتی چیست؟ هدف نهایی از دوره آموزش یادگیری تقویتی، راه‌اندازی سیستم‌های خودآموز است. سیستم‌هایی که بتوانند با درس گرفتن از تجربیات خود، به‌روز شده و واکنش‌های بهتری به شرایط نشان دهند. در واقع در این دوره ما به فراگیری مفهوم یادگیری تقویتی می‌پردازیم که در پی آن توانایی نوشتن برنامه‌ای را داریم که با کمک آن، کامپیوتر به‌جای تکرار یک مسیر ثابت، علاوه بر انجام کار، از هر بار انجام شدن کار درس می‌گیرد و دفعات بعدی آن را با خطاهای کمتری انجام خواهد داد. همان‌طور که گفتیم با یادگیری تقویتی می‌توان برنامه‌ای نوشت که کامپیوتر با استفاده از آن در برابر انسان پیروز شود. دوره آموزش یادگیری تقویتی مناسب چه کسانی است؟ علاقه‌مندان به هوش مصنوعی و فعالین در این حوزه کسانی که به حوزه علم داده علاقه‌مند هستند شاغلین و علاقه‌مندان حوزه gameplay و رباتیک دانشجویان و پژوهشگران که در زمینه علم داده فعالیت می‌کنند بعد از یادگیری دوره آموزش یادگیری تقویتی چه مهارت‌هایی کسب خواهید کرد؟ در پایان این دوره قادر خواهید بود سیستم خودآموز دلخواهتان را بسازید. علاوه بر این با توجه به اینکه در این دوره با اصطلاحات و مفاهیم اساسی این حوزه آشنا می‌شوید. پس از پایان دوره امکان مطالعه و پژوهش سطح بالا در این زمینه را هم خواهید داشت. دو موردی که گفته شد را می‌توان به‌عنوان اصلی‌ترین مزایای این دوره بیان کرد. اما علاوه بر این مورد، در پایان دوره آموزش یادگیری تقویتی به مهارت‌های زیر هم مسلط خواهید بود: آشنایی با انواع مدل‌های یادگیری تقویتی آشنایی با کتابخانه gym آشنایی با مدل‌های deep Q-learning آشنایی با مدل‌های Policy Based پیاده‌سازی روش‌های مختلف مدل کردن یادگیری تقویتی ویژگی‌های متمایز دوره آموزش یادگیری تقویتی چیست؟ شیوه آموزش این دوره ترکیبی از آموزش تئوریک و آموزش عملی است. به این صورت که ابتدا مباحث تئوری بررسی شده و سپس با پروژه‌ها و مثال‌های عملی، این یادگیری تثبیت می‌شود. علاوه بر این‌ها سعی شده است در این دوره تا حد ممکن مباحث ریاضی مربوط به یادگیری تقویتی بیان شود تا شرکت‌کننده در ادامه بتواند این مبحث را به‌صورت آکادمیک یا پژوهشی دنبال کند.

معرفی اجمالی دوره

دوره آموزش یادگیری تقویتی چیست؟ زمینه‌هایی مثل علم داده، هوش مصنوعی و یادگیری ماشین در حال حاضر محبوبیت زیادی را به خود اختصاص داده‌اند. چراکه با استفاده از این علوم می‌توان سیستم‌های هوشمند و یادگیرنده طراحی کرد و کارها را با سرعت و دقت بیشتری انجام داد. یادگیری تقویتی یا Reinforcement Learning برای ارتباط دادن یادگیری ماشین و شبکه‌های عمیق با دنیای صنعت کاربرد دارد. با یادگیری تقویتی می‌توان یک ماشین را برای انجام یک بازی به نحوی آموزش داد که در برابر انسان به پیروزی برسد. یادگیری تقویتی ارتباط بین هوش مصنوعی با صنعت را برقرار می‌کند. کاربرد اصلی یادگیری تقویتی در برنامه‌ریزی ربات‌ها و ماشین‌هایی است که به تولید کارخانه‌ها یا مدیریت انبار کمک می‌کنند. این ربات‌ها با یادگیری تقویتی تمام سناریوهای احتمالی زمان کار را فراگرفته و در زمان اتفاق افتادن هرکدام از حالات، واکنشی متناسب با آن از خود نشان می‌دهند. سیستم‌های خودآموز در دنیای امروز نقش بسیار ویژه‌ای دارند و شرکت‌هایی مثل آمازون یا اپل بر اساس این سیستم‌ها کار می‌کنند. هدف از یادگیری دوره آموزش یادگیری تقویتی چیست؟ هدف نهایی از دوره آموزش یادگیری تقویتی، راه‌اندازی سیستم‌های خودآموز است. سیستم‌هایی که بتوانند با درس گرفتن از تجربیات خود، به‌روز شده و واکنش‌های بهتری به شرایط نشان دهند. در واقع در این دوره ما به فراگیری مفهوم یادگیری تقویتی می‌پردازیم که در پی آن توانایی نوشتن برنامه‌ای را داریم که با کمک آن، کامپیوتر به‌جای تکرار یک مسیر ثابت، علاوه بر انجام کار، از هر بار انجام شدن کار درس می‌گیرد و دفعات بعدی آن را با خطاهای کمتری انجام خواهد داد. همان‌طور که گفتیم با یادگیری تقویتی می‌توان برنامه‌ای نوشت که کامپیوتر با استفاده از آن در برابر انسان پیروز شود. دوره آموزش یادگیری تقویتی مناسب چه کسانی است؟ علاقه‌مندان به هوش مصنوعی و فعالین در این حوزه کسانی که به حوزه علم داده علاقه‌مند هستند شاغلین و علاقه‌مندان حوزه gameplay و رباتیک دانشجویان و پژوهشگران که در زمینه علم داده فعالیت می‌کنند بعد از یادگیری دوره آموزش یادگیری تقویتی چه مهارت‌هایی کسب خواهید کرد؟ در پایان این دوره قادر خواهید بود سیستم خودآموز دلخواهتان را بسازید. علاوه بر این با توجه به اینکه در این دوره با اصطلاحات و مفاهیم اساسی این حوزه آشنا می‌شوید. پس از پایان دوره امکان مطالعه و پژوهش سطح بالا در این زمینه را هم خواهید داشت. دو موردی که گفته شد را می‌توان به‌عنوان اصلی‌ترین مزایای این دوره بیان کرد. اما علاوه بر این مورد، در پایان دوره آموزش یادگیری تقویتی به مهارت‌های زیر هم مسلط خواهید بود: آشنایی با انواع مدل‌های یادگیری تقویتی آشنایی با کتابخانه gym آشنایی با مدل‌های deep Q-learning آشنایی با مدل‌های Policy Based پیاده‌سازی روش‌های مختلف مدل کردن یادگیری تقویتی ویژگی‌های متمایز دوره آموزش یادگیری تقویتی چیست؟ شیوه آموزش این دوره ترکیبی از آموزش تئوریک و آموزش عملی است. به این صورت که ابتدا مباحث تئوری بررسی شده و سپس با پروژه‌ها و مثال‌های عملی، این یادگیری تثبیت می‌شود. علاوه بر این‌ها سعی شده است در این دوره تا حد ممکن مباحث ریاضی مربوط به یادگیری تقویتی بیان شود تا شرکت‌کننده در ادامه بتواند این مبحث را به‌صورت آکادمیک یا پژوهشی دنبال کند.

ویژگی‌های دوره

-گواهی‌نامه مکتب‌خونه -خدمات منتورینگ -پروژه محور -تمرین و آزمون -تالار گفتگو -تسهیل استخدام

فصول دوره

-فصل اول: آشنایی با یادگیری تقویتی
-فصل دوم: مسئله‌ی راهزن چنددست (Multi-Armed Bandit)
-فصل سوم: تعاریف یادگیری تقویتی
-فصل چهارم: برنامه‌نویسی پویا (Dynamic Programming)
-فصل پنجم: روش‌های مبتنی بر جدول (Tabular)
-فصل ششم: استفاده از تخمین‌گر
-فصل هفتم: Policy Gradient
-فصل هشتم: پروژه پایانی;

معرفی مدرس

علی قندی
علی قندی تحصیلات خود در رشته‌ی مهندسی برق گرایش سیستم‌های دیجیتال را از سال ۹۲ در دانشگاه صنعتی شریف آغاز نمود. کارشناسی ارشد خود را در همین دانشگاه در زمینه علوم داده گذرانده و از سال 1399 مقطع دکترا را در این زمینه آغاز نموده است. وی از سال ۱۳۹۵ فعالیت خود در زمینه‌ی هوش مصنوعی را بصورت تخصصی آغاز کرده و پروژه‌های متعدد یادگیری ماشین و شبکه‌ی عمیق در زمینه‌های گوناگون را به انجام رسانیده است. وی همچنین به‌عنوان مشاور و متخصص تحلیل داده در شرکت‌های مطرح مشغول به فعالیت است.

پیش‌نیازها

برای بهره‌بردن از مزایای آموزشی این دوره، باید ابتدا تسلط کافی به زبان برنامه‌نویسی پایتون و همچنین مفاهیم اساسی هوش مصنوعی و شبکه عصبی داشته باشید. بدون برخورداری از این موارد، شرکت در این دوره کمک چندانی به شما نخواهد کرد. علاوه بر این تمام کدها روی colab.research.google.com اجرا می‌شوند تا تمام شرکت‌کنندگان به قدرت محاسباتی و سرعت یکسانی دسترسی داشته باشند و در نتیجه عدالت بین همه رعایت شود.

روش ارزیابی و نمره‌دهی

حد نصاب قبولی در دوره: 80.0 نمره فارغ‌التحصیل شدن در این دوره نیاز به ارسال تمرین‌ها و پروژه‌های الزامی دارد.

نمونه گواهینامه

منبع: جاب ویژن
جاب ویژن
415,650 تومان
دریافت فایل
چهارشنبه 3 مرداد 1403، ساعت 05:40