|
عنوان
|
تشخیص سرطان سینه با رویکرد متوازنسازی مجموعه دادهها
|
|
نوع پژوهش
|
مقاله چاپشده
|
|
کلیدواژهها
|
دادههای نامتوازن، نمونهبرداری فزاینده، oversampling، تشخیص خودکار بیماری.
|
|
چکیده
|
چکیده - یکی از چالشهای بزرگ در تشخیص خودکار بیماریها، وجود مجموعه دادههای نامتوازن است. عدم توازن در کلاسهای داده، باعث شکست در تشخیص صحیح بیماری توسط سیستمهای تشخیصی میشود. این پژوهش الگوریتم جدیدی برای انتخاب و متوازن سازی نمونهها پیشنهاد داده که بر پایه الگوریتم ReliefF، یک الگوریتم انتخاب ویژگی، است. در الگوریتم پیشنهادی، ابتدا نمونهها بر اساس شاخص مشابهت با نمونههای همکلاسی و کلاس مخالف، وزندهی میشوند. پس از رتبهبندی نمونهها بر اساس وزن آنها، مجموعه داده با استفاده از روش نمونهبرداری فزاینده(oversampling) متوازن میشود. الگوریتم ارائه شده توانایی کار با مجموعه دادههای چند کلاسه و انواع دادههای رشتهای و عددی و وجود مقادیر مفقود را دارد. علاوه بر این، به دلیل امکان انجام محاسبات به طور موازی برای هر نمونه، سربار محاسباتی کمی نسبت به سایر الگوریتمهای متوازنسازی را دارد. این الگوریتم میتواند دادهها را به طور کامل متوازن کرده و نمونههای با اهمیت را تکثیر کند. الگوریتم پیشنهادی روی سه مجموعه سرطان سینه ویسکانسین (WBCD)، مجموعه تشخیصی سرطان سینه ویسکانسین (WDBCD) و مجموعه سرطان سینه SEER اجرا شده است و سپس مجموعههای متوازن شده با الگوریتمهای مختلف طبقه بندی شدند. نتایج طبقهبندی نشان دهنده کارایی روش پیشنهادی و افزایش دقت تشخیص بیماری هستند.
|
|
پژوهشگران
|
زینب عباسی (نفر اول)
|