در این تکلیف لازم است داد ههای مربوط به تشخیص بیماری دیابت را مورد بررسی و تحلیل قرار
دهید. دیتاستی که در اختیار شما قرار گرفته شامل مجموعهای از ویژگیهای پزشکی افراد است که
هدف آن پیشبینی وضعیت سلامتی آنها از نظر ابتلا به دیابت است. وظیفه شما این است که با
استفاده از این دادهها، یک فرایند کامل علمداده را بر اساس متدولوژی CRISP–DM اجرا کنید و
نتایج را همراه با مستندات و تصاویر ارائه دهید .
این داد هها شامل اطلاعاتی مانند میزان گلوکز خون، فشار خون، شاخص توده بدنی (BMI) ، تعداد
بارداریها، سطح انسولین، ضخامت پوست، سن و سایر ویژگیهای مرتبط با سلامتی است. متغیر
هدف در این پروژه ستون Outcome است که نشان میدهد فرد دیابتی 1 است یا غیر دیابتی
صفر.
شما موظف هستید با تحلیل این ویژگیها، درک مناسبی از ماهیت دادهها بهدست آورید و براساس
آن یک مدل طبقهبندی مناسب بسازید .
در این تکلیف، شما باید :
•
داد هها را بهصورت کامل بررسی کنید
•
کیفیت و ساختار آنها را تحلیل نمایید
•
مشکلات احتمالی مانند مقادیر گمشده و دادههای نامتعارف را شناسایی و اصلاح کنید
•
داد هها را آماده مدلسازی نمایید
•
چند مدل طبقهبندی مختلف ایجاد و دقت آنها را ارزیابی کرده
•
بهترین مدل را بر اساس نتایج انتخاب کنید
این کار باید در محیط IBM SPSS Modeler انجام شود و تمامی مراحل )شامل تصاویر نودها و
خروجیها( در گزارش شما مستندسازی شود .
این آگهی از وبسایت کارلنسر پیدا شده، با زدن دکمهی تماس با کارفرما، به وبسایت کارلنسر برین و از اونجا برای این شغل اقدام کنین.
هشدار
توجه داشته باشید که دریافت هزینه از کارجو برای استخدام با هر عنوانی غیرقانونی است. در صورت مواجهه با موارد مشکوک، با کلیک بر روی «گزارش مشکل آگهی» به ما در پیگیری تخلفات کمک کنید.