دو مجموعه داده از آگهی های فروش ماشین های کارکرده، جمع آوری شده از یک پلتفرم داخلی در اختیار شما قرار داده شده است. مجموعه داده آموزشی (Train) دارای ستون قیمت و حاوی مقادیر قیمت اعلام شده برای هر ماشین می باشد. می خواهیم یک مدل یادگیری ماشین، با استفاده از روش های یادگیری با ناظر (Supervised Learning) بسازیم، که با دریافت اطلاعات ماشین (Features)، تخمینی قابل قبول برای قیمت آن را محاسبه کند.
مجموعه داده دوم نیز به عنوان مجموعه تست (Test Dataset) در اختیار شما قرار گرفته است؛ این مجموعه فاقد اطلاعات قیمت می باشد و فقط حاوی اطلاعات هر آگهی (Features) می باشد. مدل های ساخته شده توسط شما با استفاده از این مجموعه تست، ارزیابی خواهند شد. قیمت هر ماشین در مجموعه داده تست باید توسط مدل آموزش دیده شما پیش بینی شود.
ویژگی های موجود از هر ماشین به صورت زیر است:
برخی نکات مهم برای حل بهتر مسئله:
نحوه ارسال پاسخ
پس از ساخت یک مدل یادگیری ماشین، تمام رکورد های موجود در مجموعه تست را، بدون هیچ گونه تغییر در ترتیب، یا حذف آن ها، به مدل خود داده و مقدار قیمت را برای آن ها محاسبه کنید. سپس قیمت های حاصله را با همان ترتیب در یک فایل csv و در ستونی با نام price ذخیره کرده و در قسمت ارسال پاسخ در پلتفرم سکو آپلود کنید. سکو بلافاصله پس از آپلود پاسخ، آن را ارزیابی کرده و امتیاز پاسخ ارسالی را ثبت می کند.