سلام دوستان
من میخوام پیاده سازی روش های یادگیری تقویتی (روش هایی مانند Q-learning, deep Q-learning, SARSA, PPO) را در مسائل بهینه سازی بهم آموزش بدهند. محیط پیاده سازی هم پایتون هست. چندین کد در گیت ...
حقوق 750,000 - 5,000,000 تومان
امکان دورکاری
پروژهای