سلام وقت بخیر
من کدهای مربوط به یادگیری تقویتی چندهدفه رو روی محیط های بنچمارک چند هدفه مثل deep sea treasures Cartpole و... نیاز دارم با الگوریتمهای dqn چندهدفه، mpmoqlearning ,pareto qlearning و mo...
حقوق 2,500,000 - 6,000,000 تومان
امکان دورکاری
پروژهای