ارائه چارچوبی جامع از ویژگی های مؤثر در تشخیص اخبار جعلی:یک مرور نظام مند

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری مدیریت فناوری اطلاعات، گروه مدیریت، دانشکده علوم اداری و اقتصادی، دانشگاه فردوسی مشهد، مشهد، ایران

2 دکتری سیستم های اطلاعاتی مدیریت، استاد؛ گروه مدیریت؛ دانشکده علوم اداری و اقتصادی؛ دانشگاه فردوسی مشهد؛ مشهد، ایران

3 استاد؛ گروه مدیریت؛ دانشکده علوم اداری و اقتصادی؛ دانشگاه فردوسی مشهد؛ مشهد، ایران

4 استادیار؛ گروه مهندسی کامپیوتر؛ دانشکده مهندسی؛ دانشگاه فردوسی مشهد؛ مشهد، ایران

چکیده

در طول سال‌های اخیر، با توسعه سریع و افزایش محبوبیت رسانه‌های اجتماعی، شاهد رشد گسترده‌ای در حجم و تنوع اخبار جعلی بوده‌ایم. این پدیده اثرات عمیقی بر روی افراد و جامعه دارد. راستی‌آزمایی روشی است که به طور گسترده‌ای برای مقابله با اثرات منفی انتشار اخبار جعلی استفاده می‌شود. اما این روش هنگام تحلیل حجم عظیم اطلاعات کارآمد نیست. بنابراین از مدل های پیشرفته یادگیری ماشین و رویکردهای مبتنی بر ویژگی برای شناسایی خودکار اخبار جعلی استفاده می شود. در عین حال، تعداد زیاد مدل‌ها و ناهمگونی ویژگی‌های مورد استفاده در ادبیات، اغلب محدودیت‌هایی را برای محققانی که سعی در بهبود عملکرد مدل دارند، ایجاد می کند. به همین دلیل، در مطالعه حاضر با روش مرورسیستماتیک، چارچوب جامعی از ویژگی‌هایی که در تشخیص اخبار جعلی استفاده می‌شوند ارائه شده‌است. به منظور انجام این مرور سیستماتیک با استفاده از راهنمای ارائه شده توسط اوکولی و اسچابرام، کلیه مطالعات انجام گرفته در حوزه اخبار جعلی با استفاده ازکلیدواژه‏های مرتبط، از پایگاه داده‎های ScienceDirect، Springer، Emerald، IEEE، ACM، Wiley، Sage، JSTOR، Taylor و WOS استخراج شد و درنهایت تعداد 72 مقاله مرتبط مورد بررسی قرار گرفته است. در نتیجه تحلیل مقالات مرتبط، ویژگی ها در دو طبقه اصلی محتوای خبر و زمینه خبر قرار گرفتند. محتوای خبر شامل ویژگی های زبانی و معنایی، ویژگی های بصری و ویژگی های مبتنی بر سبک می باشند. زمینه خبر نیز شامل ویژگی های مبتنی بر کاربر، پست و شبکه است. نتایج به دست آمده نشان داد که پرکاربردترین ویژگی‌ها در تشخیص اخبار جعلی ویژگی های مبتنی بر پروفایل کاربر، ویژگی های سبک آماری، الگوی نوشتاری و خوانایی هستند. با توجه به تنوع بالای ویژگی‌های موجود پیشنهاد می شود ارزیابی گسترده‌ای از ویژگی ها، مدل ها و همچنین عملکرد آنها در مجموعه داده های متعدد انجام شود و از این طریق عملکرد مدل ها و مجموعه ویژگی های مختلف مقایسه گردد تا بهترین ترکیب ویژگی در شرایط مختلف مشخص گردد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Presenting a Comprehensive Framework of Effective Features in Fake News Detection: a Systematic Review

نویسندگان [English]

  • Elham Mazaheri 1
  • Mohammad Mehraeen 2
  • Mostafa Kazemi 3
  • Kamaledin Ghiasi Shirazi 4
1 PhD Candidate in Information Technology Management; Department of Management; Faculty of Economics and Administrative Sciences; Ferdowsi University of Mashhad; Mashhad, Iran
2 PhD in Management Information Systems; Professor; Department of Management; Faculty of Economics and Administrative Sciences; Ferdowsi University of Mashhad; Mashhad, Iran
3 Professor; Department of Management, Faculty of Economics and Administrative Sciences, Ferdowsi University of Mashhad, Mashhad, Iran
4 Assistant Professor; Department of Computer Engineering; Faculty of Engineering; Ferdowsi University of Mashhad; Mashhad, Iran
چکیده [English]

Over recent years, with the rapid development and increasing popularity of social media, we have seen a massive growth in the volume and variety of fake news. This phenomenon has profound effects on individuals and society. Verification is a widely used method to counter the negative effects of fake news. But this method is not efficient when analyzing huge amount of data. Therefore, advanced machine learning models and feature-based approaches are used to automatically identify fake news. At the same time, the large number of models and the heterogeneity of features used in the literature often create limitations for researchers trying to improve model performance. For this reason, in the present study, a comprehensive framework of the features used in the detection of fake news is presented with a systematic review method. In order to carry out this systematic review, using the guide provided by Okuli and Schabram, all studies conducted in the field of fake news using related keywords were taken from ScienceDirect, Springer, Emerald, IEEE, ACM, Wiley, Sage databases. , JSTOR, Taylor and WOS were extracted and finally 72 related articles were analyzed. As a result of the analysis of related articles, the features were placed in two main categories of news content and news context. News content includes linguistic and semantic features, visual features and style-based features. The news field also includes features based on user, post and network. The obtained results showed that the most used features in detecting fake news are features based on user profile, features of statistical style, writing pattern and readability. Due to the high variety of available features, it is suggested that a wide evaluation of features, models and their performance in multiple data sets should be done and in this way the performance of different models and feature sets should be compared in order to find the best combination of features in different conditions. to become clear.

کلیدواژه‌ها [English]

  • Fake news
  • feature
  • content-based features
  • context-based features
  • systematic reviews