سلام. وقت بخیر. من یک تمرین طبقه بندی چهار کلاسه دارم که شامل 8 دیتاست هستش و هر دیتا ست شامل یک تعداد ویژگی است که در کل حدود 3000 ویژگی و هر کلاس هم حدود 25 سمپل دارد. باید معیارهای صحت، حساسیت و ... برای هر کلاس در هر دیتاست و ترکیب دیتاست ها بالای 95 برسه. اما خودم به جواب حدود 83 با طبقه بند های xgboost , svm و RF می رسم. می خواستم از شما کمک بگیرم که امکانش است با نرم افزار های R یا متلب یا پایتون به ترتیب اولویت پیاده سازی کنید و به این جواب ها برسید. من مراحل پیش پردازش داده ها و انتخاب ویژگی و بعد اعمال به کلاسیفیرها را انجام دادم اما متاسفانه به جواب مطلوب نمی رسم. خواستم راهنمایی بگیریم شاید با الگوریتم خاصی جواب بده. یا اینکه پیشنهاد بدم دیتاها به تصویر تبدیل بشه و به CNN بدیم شاید بهتر شد و ... ممنون میشم راهنمایی کنید در خصوص اجرای شدن کار، زمان و هزینه. ممنونم نرم افزار R در اولویت است، اما اگر برای رسیدن به جوابمطلوب از نرمافزاهای متلب یا پایتوناستفاده شود مشکلی نیست(مهم رسیدن به جواب بهتر در طبقه بندی است که برای اینکار بالای 95درصد در معیارهای حساسیت و صحت مدنظر است). همانطورکه در پیام بالا گفتم، 8 دیتاست مختلف وجود دارد (8 فایل اکسل)، تعداد ویژگی در هر دیتاست مختلف هستش (ستون های فایل ها ویژگیها هستند) و 109 سمپل (سطرهای فایل سمپل ها هستند که تقریبا هر 25 سمپل در یککلاس قرار دارند) هم در هر دیتاست وجود دارد که می خواهم با آن ها یک مسئله طبقه بندی چهار کلاسه را انجام دهم به طوریکه با ترکیب این دیتاست ها نتیجه معیارهای ارزیابی مدل طبقه بندی شامل حسایت و ... به بالا 95درصد برسد. البته نتیجه طبقه بندی هرکلاس هم باید مشخص باشد.ممکن است یک دیتاست خیلی در نتیجه نهایی تاثیر نداشته باشد و ترکیب مثلا 5 تا بهترین جواب را بدهد که باید مشخص شود کدام دیتاست ها و چه ویژگیهایی در ایننتیجه تاثیر داشتند. با چه روش طبقه بندی و چه شیوه ای انجام شود مهم نیست، میتونه روش ابتکاری هم باشه ولی مهم هستش که نتایج طبقه بندی مدنظر بدست بیاد. خیلی فوری نیست و فرصت وجود دارد لطفا هزینه و زمان انجام کار را می فرمایید؟ +++
این آگهی از وبسایت کافه پروژه پیدا شده، با زدن دکمهی تماس با کارفرما، به وبسایت کافه پروژه برین و از اونجا برای این شغل اقدام کنین.