استفاده از مدل LRFM برای خوشه‌بندی کاربران بر اساس تحلیل رفتار جست‌وجو (مورد مطالعه: پایگاه اطلاعات علمی ایران «گنج»)

نویسندگان

پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)، تهران، ایران

چکیده

پایگاه اطلاعاتی «گنج» پژوهشگاه علوم و فناوری اطلاعات با برخورداری از نزدیک به یک میلیون رکورد علمی امکان جست‌وجو در پایان‌نامه‌ها، نشریات علمی داخلی، مقالات، همایش‌ها، طرح‌های پژوهشی وگزارش‌های دولتی را فراهم می‌کند. روزانه تعداد زیادی از پژوهشگران نیازهای منابع علمی و پژوهشی خود را از پایگاه «گنج» تأمین می‌کنند. نیازها و رفتارهای کاربران مختلف این پایگاه متنوع بوده و شناخت دقیق‌تر آن موجب خواهد شد که مدیران این پایگاه بتوانند استراتژی‌های متناسب با هر یک از گروه‌های کاربران را به‌منظور مدیریت بهتر پایگاه و ارائه خدمات کاراتر اتخاذ نمایند. یکی از راه‌های شناخت کاربران، خوشه‌بندی آن‌ها و شناخت ویژگی‌های هر خوشه است. هدف این پژوهش، خوشه‌بندی کاربران بر اساس تحلیل رفتار جست‌وجوی آن‌ها با استفاده از مدل LRFM است. در این پژوهش، داده‌های لاگ جست‌وجوی کاربران پایگاه «گنج» به‌ مدت سه ‌ماه جمع‌آوری و مورد استفاده قرار گرفت. با استفاده از داده‌های لاگ رفتار جست‌وجوی کاربران، شاخص‌های مدل LRFM محاسبه و سپس، الگوریتم K-means بر روی آن‌ها اعمال و تعداد خوشه بهینه بر اساس معیارهای مختلف محاسبه شد. نتایج به‌دست‌آمده از خوشه‌بندی بر اساس ماتریس ارزش مشتری، کاربران را در چهار گروه بهره‌مند مشکوک، نامطمئن و متناوب قرار می‌‌دهد و بر اساس ماتریس وفاداری، کاربران در چهار گروه وفادار، بالقوه، نامطمئن و تازه‌وارد ارزیابی می‌شوند.

کلیدواژه‌ها


عنوان مقاله [English]

Users clustering Based on Search Behavior Analysis Using the LRFM Model (Case Study: Iran Scientific Information Database (Ganj))

نویسندگان [English]

  • Somayeh Fatahi
  • Mohammad Rabiei
چکیده [English]

Iran scientific information database (Ganj) which includes almost one million scientific records provides the search opportunity in dissertations, domestic scientific journals, articles, conferences, research projects, and governmental reports. A large number of researchers meet the needs of their scientific and research resources from Ganj database daily. Users’ needs and behaviors are variant and understanding it helps system administrators to use different strategies to manage the better databases and provide efficient services to users. One way to understand users’ needs is to cluster them based on their behavior and identify the features of each cluster. This study aims to cluster the users based on the analysis of their search behavior using the LRFM model. In this study, the search log data of Ganj users were collected for three months, the LRFM attributes were calculated, and then the K-means algorithm was applied to them. The optimal number of clusters was calculated based on different criteria. Based on customer value matrix the results of customer clustering users in four groups are efficient, suspicious, unreliable, and intermittent and based on customer loyalty Marcus users are categorized in loyal, potential, insecure and newcomers.

کلیدواژه‌ها [English]

  • Clustering
  • LRFM Model
  • Marcus Customer Value Matrix
  • User Behavior Analysis
  • Ganj Database