مشخصات پژوهش

صفحه نخست /پیش‌بینی محبوبیت اخبار ...
عنوان پیش‌بینی محبوبیت اخبار آنلاین: یک تحلیل مقایسه‌ای مبتنی بر انتخاب ویژگی و یادگیری ماشین
نوع پژوهش مقاله ارائه شده
کلیدواژه‌ها پیش‌بینی محبوبیت، اخبار آنلاین، یادگیری ماشین، جنگل تصادفی، مجموعه داده Mashable
چکیده پیش‌بینی محبوبیت اخبار آنلاین پیش از انتشار، یکی از چالش‌های مهم در حوزه رسانه‌های دیجیتال است. این پژوهش با هدف ارائه یک سیستم پیش‌بینی بر اساس ویژگی‌های قابل استخراج پیش از انتشار انجام شد. از مجموعه‌داده Mashable شامل مشخصات 39797 مقاله خبری در قالب ۵۸ ویژگی متنی، ساختاری و آماری استفاده گردید و با اعمال آستانه ۱۴۰۰ اشتراک برای تمایز مقالات کم‌بازدید از پربازدید، مسئله به یک طبقه‌بندی دودویی متوازن تبدیل شد. چهار الگوریتم یادگیری ماشین شامل جنگل تصادفی، شبکه عصبی چندلایه، درخت تصمیم C4.5 و بیزین ساده با استفاده از روش اعتبارسنجی متقابل ۵-تایی ارزیابی و مقایسه شدند. نتایج نشان داد که جنگل تصارفی با دقت 66.32 %، شاخص Kappa 0.33 و مساحت زیر منحنی ROC معادل 0.725 بهترین عملکرد را دارد و قادر است ۳۳٪ بهتر از یک طبقه‌بندی تصادفی عمل نماید. شبکه عصبی با دقت 61.21% و درخت تصمیم با دقت ۵۸/۳۶٪ در رده‌های بعدی قرار گرفتند، در حالی که بیزین ساده با دقت ۵۴/۲۱٪ کمترین کارایی را نشان داد. این پژوهش گامی اولیه در مسیر طراحی سیستم‌های پشتیبان تصمیم‌گیری هوشمند برای تولیدکنندگان محتوای خبری است و می‌تواند با توسعه ویژگی‌های پیشرفته‌تر و استفاده از مدل‌های یادگیری ترکیبی، به سطح دقت عملیاتی بالاتری دست یابد.
پژوهشگران زینب عباسی (نفر اول)