مشخصات پژوهش

صفحه نخست /تشخیص سرطان سینه با رویکرد ...
عنوان تشخیص سرطان سینه با رویکرد متوازن‌سازی مجموعه داده‌ها
نوع پژوهش مقاله چاپ‌شده
کلیدواژه‌ها داده‌های نامتوازن، نمونه‌برداری فزاینده، oversampling، تشخیص خودکار بیماری.
چکیده چکیده‌ - یکی از چالش‌های بزرگ در تشخیص خودکار بیماری‌ها، وجود مجموعه داده‌های نامتوازن است. عدم توازن در کلاس‌های داده، باعث شکست در تشخیص صحیح بیماری توسط سیستم‌های تشخیصی می‌شود. این پژوهش الگوریتم جدیدی برای انتخاب و متوازن سازی نمونه‌ها پیشنهاد داده که بر پایه الگوریتم ReliefF، یک الگوریتم انتخاب ویژگی، است. در الگوریتم پیشنهادی، ابتدا نمونه‌ها بر اساس شاخص مشابهت با نمونه‌های همکلاسی و کلاس مخالف، وزن‌دهی می‌شوند. پس از رتبه‌بندی نمونه‌ها بر اساس وزن‌ آن‌ها، مجموعه داده‌ با استفاده از روش نمونه‌برداری فزاینده(oversampling) متوازن می‌شود. الگوریتم ارائه شده توانایی کار با مجموعه داده‌های چند کلاسه و انواع داده‌های رشته‌ای و عددی و وجود مقادیر مفقود را دارد. علاوه بر این، به دلیل امکان انجام محاسبات به طور موازی برای هر نمونه، سربار محاسباتی کمی نسبت به سایر الگوریتم‌های متوازن‌سازی را دارد. این الگوریتم ‌می‌تواند داده‌ها را به طور کامل متوازن کرده و نمونه‌های با اهمیت را تکثیر کند. الگوریتم پیشنهادی روی سه مجموعه سرطان سینه ویسکانسین (WBCD)، مجموعه تشخیصی سرطان سینه ویسکانسین (WDBCD) و مجموعه سرطان سینه SEER اجرا شده است و سپس مجموعه‌های متوازن شده با الگوریتم‌های مختلف طبقه بندی شدند. نتایج طبقه‌بندی نشان دهنده کارایی روش پیشنهادی و افزایش دقت تشخیص بیماری هستند.
پژوهشگران زینب عباسی (نفر اول)