ارزیابی کیفیت پر مشاهده‌ترین وب‌سایت‌های خبری در ایران مبتنی بر روش یادگیری ماشین

نویسندگان

دانشگاه تهران

10.35050/JIPM010.2017.053

چکیده

موفقیت و کارایی وب‌سایت‌ها تا حد زیادی وابسته به کیفیت آن‌هاست. بزرگ‌ترین سهم از مفهوم جدید کیفیت این است که جنبه‌های فنی محصولات و سرویس‌ها با استفاده و برداشت مشتریان ترکیب می‌شود. بنابراین، ارزیابی وب‌سایت‌ها بر اساس بیشترین استفاده و درک از سمت مشتریان امر مهمی به شمار می‌آید تا موفقیت یک وب‌سایت را به سازمان‌های مربوطه اعلام کند. این رتبه‌بندی و ارزیابی بایستی در یک دامنه خاصِ فعالیتی صورت گیرد، تا رتبه وب‌سایت در برابر رقبای آن تعیین گردد. این پژوهش بر آن  است که بتوان ارزیابی وب‌سایت‌ها را با به‌دست‌آوردن اطلاعات آن‌ها به‌صورت خودکار و بدون دخالت نیروی انسانی، به‌صورت لحظه‌ای و بلادرنگ ممکن ساخت. برای این منظور از دو روش یادگیری ماشین، شبکه عصبی و ماشین بردار پشتیبان استفاده شده‌ است. از آنجا که از الگوریتم یادگیری با نظارت در این روش‌ها استفاده کرده‌ایم، نیاز به داده‌های برچسب‌دار وجود داشت که به‌‌جای برچسب‌دارکردن خروجی‌ها توسط خبرگان و به‌صورت دستی از یکی از روش‌های تصمیم‌گیری چندمعیاره (MCDM) به‌نام «تاپسیس» کمک گرفته شده است. در این روش وزن‌های معیارهای ارزیابی با استفاده از روش آنتروپی به‌صورت خودکار محاسبه گردیده است. در نهایت، رتبه‌بندی 791 وب‌سایت‌ خبری که بر اساس گزارش «الکسا» بیشترین بازدیدکننده از طرف کاربران ایرانی را داشته‌اند، با روش «تاپسیس» حاصل شد، ولی از سمت دیگر ارائه یک رتبه عددی به‌عنوان خروجی نهایی ارزیابی وب‌سایت‌ها چندان با هدف رقابت آن‌ها همخوانی ندارد. به‌همین خاطر، از این رتبه‌های عددی به‌عنوان خروجی روش‌های یادگیری ماشین به‌‌جای رتبه‌بندی خبرگان و افراد استفاده گردید تا بتوان وب‌سایت‌ها را در شش طبقه جداگانه، از بسیار عالی تا بسیار ضعیف، برچسب‌دار نمود. در ادامه، از روش‌های یادگیری ماشین ذکرشده جهت طبقه‌بندی و همچنین، پیش‌بینی طبقه یک وب‌سایت جدید استفاده شده‌ است. در نهایت، این پژوهش به این نتیجه رسید که امکان طراحی سیستمی با دقت بالا برای ارزیابی وب‌سایت‌های خبری با روش شبکه عصبی و ماشین بردار پشتیبان وجود دارد، به‌گونه‌ای که این سیستم از عوامل مهم تأثیرگذار بر کیفیت وب‌سایت‌های خبری تشکیل شده و به‌صورت خودکار قابلیت جمع‌آوری اطلاعات آن‌ها وجود داشته باشد.

کلیدواژه‌ها


عنوان مقاله [English]

Evaluation of Most Visited News Websites in Iran based on Machine learning

نویسندگان [English]

  • Babak Sohrabi
  • Amir Manian
  • Molood Arman
چکیده [English]

Success and effectiveness of websites is largely dependent on the quality of the website. The biggest share of the quality`s new concept is that the technical aspects of products and services combines with customers usage and understanding. Therefore, websites evaluation based on the maximum usage and perception of the customers is considered an important issue to announce to the related organizations the success of website. This ranking and evaluation should be performed in a special activity domain so that the first place of website rank determines among its other competitors. In this article achieving the information of websites is automatic and without the intervention of human so that the instant evaluation could be possible. In this study, one of the Multi criteria Decision-making methods called TOPSIS is used and the weights of the criteria have been achieved of the method entropy in the mentioned method. Eventually, according to the Alexa ranking report the 791 ranking news website have been obtained which have most visitors of the Iranian users, but on the other hand, just a numerical rank as a final output of websites evaluation can’t be very inconsistent with the purpose of competition between websites, so, these numerical ranking from TOPSIS method used as output in machine learing method for seprating websites from excellent to very poor in six categories as lables for training dataset in classification, instead of using manual lables achieved from experts and users’ opinion. For this classification, Machine learning techniques, including artificial neural network and support vector machine were used.

کلیدواژه‌ها [English]

  • web sites evaluation
  • news websites
  • TOPSIS
  • Automation
  • Machine Learning
  • Neural network
  • Support Vector Machine