|
عنوان
|
پیشبینی محبوبیت اخبار آنلاین: یک تحلیل مقایسهای مبتنی بر انتخاب ویژگی و یادگیری ماشین
|
|
نوع پژوهش
|
مقاله ارائه شده
|
|
کلیدواژهها
|
پیشبینی محبوبیت، اخبار آنلاین، یادگیری ماشین، جنگل تصادفی، مجموعه داده Mashable
|
|
چکیده
|
پیشبینی محبوبیت اخبار آنلاین پیش از انتشار، یکی از چالشهای مهم در حوزه رسانههای دیجیتال است. این پژوهش با هدف ارائه یک سیستم پیشبینی بر اساس ویژگیهای قابل استخراج پیش از انتشار انجام شد. از مجموعهداده Mashable شامل مشخصات 39797 مقاله خبری در قالب ۵۸ ویژگی متنی، ساختاری و آماری استفاده گردید و با اعمال آستانه ۱۴۰۰ اشتراک برای تمایز مقالات کمبازدید از پربازدید، مسئله به یک طبقهبندی دودویی متوازن تبدیل شد. چهار الگوریتم یادگیری ماشین شامل جنگل تصادفی، شبکه عصبی چندلایه، درخت تصمیم C4.5 و بیزین ساده با استفاده از روش اعتبارسنجی متقابل ۵-تایی ارزیابی و مقایسه شدند. نتایج نشان داد که جنگل تصارفی با دقت 66.32 %، شاخص Kappa 0.33 و مساحت زیر منحنی ROC معادل 0.725 بهترین عملکرد را دارد و قادر است ۳۳٪ بهتر از یک طبقهبندی تصادفی عمل نماید. شبکه عصبی با دقت 61.21% و درخت تصمیم با دقت ۵۸/۳۶٪ در ردههای بعدی قرار گرفتند، در حالی که بیزین ساده با دقت ۵۴/۲۱٪ کمترین کارایی را نشان داد. این پژوهش گامی اولیه در مسیر طراحی سیستمهای پشتیبان تصمیمگیری هوشمند برای تولیدکنندگان محتوای خبری است و میتواند با توسعه ویژگیهای پیشرفتهتر و استفاده از مدلهای یادگیری ترکیبی، به سطح دقت عملیاتی بالاتری دست یابد.
|
|
پژوهشگران
|
زینب عباسی (نفر اول)
|