بررسی توسعه و روند موضوعی حوزه علم اطلاعات و دانش‌شناسی بر اساس مدل موضوعی LDA

نویسندگان

دانشگاه اصفهان؛ اصفهان، ایران؛

چکیده

هدف پژوهش حاضر شناسایی روند موضوعی مقالات ایرانیان در حوزه علم اطلاعات و دانش‌شناسی با استفاده از الگوریتم‌های مدل‌سازی موضوعی LDA و مدل رگرسیون خطی است. جامعه پژوهش شامل 709 مقاله دارای چکیده و نمایه‌شده در پایگاه «اسکوپوس» در بازه زمانی 2008- 2019 است. به‌منظور دستیابی به اهداف پژوهش، داده‌ها با استفاده از الگوریتم‌های متن‌کاوی و به‌طور خاص الگوریتم‌های مدل‌سازی موضوعی LDA با استفاده از نرم‌افزار R مورد تحلیل قرار گرفت. تحلیل داده نشان داد که از بین موضوعات استخراج‌شده مواردی بودند که از محبوبیت پژوهشی بالایی برخوردار بوده و جزء موضوعات داغ محسوب شدند. در گروه موضوعات داغ، موضوع خدمات کتابخانه‌ای در شبکه‌های اجتماعی، مدل‌های پژوهش، سرمایه اجتماعی، پایگاه‌های اطلاعاتی پزشکی، داده‌کاوی، روند تولید علمی، موضوع‌های بین‌ رشته‌ای، الگوریتم‌های فضای مجازی، مدیریت دانش، مطالعات شبکه‌های اجتماعی، رویکردهای پژوهشی و آینده‌پژوهی قرار دارند و همچنین موضوعاتی که از محبوبیت پژوهشی کمتری برخوردار بوده و جزء موضوعات سرد و کم‌طرفدار قلمداد می‌شوند شامل حوزه‌های موضوعی منابع الکترونیکی، سیستم مدیریت اطلاعات، موتورهای جست‌وجو، خدمات امانت، خدمات از راه دور، یادگیری الکترونیکی، دولت الکترونیک، شاخص‌های ارزیابی مجلات، ارزیابی منابع وبی و کتابخانه‌های دیجیتال هستند. نتایج نشان داد که پژوهش‌های موضوعی رشته علم اطلاعات و دانش‌شناسی در ایران همگام با رشد فناوری‌ها و موضوع‌های جهانی توسعه‌‌یافته و ارتباط حوزه موضوعی علم اطلاعات و دانش‌شناسی را با زمینه‌های نوین داده‌کاوی، هوش مصنوعی، بازیابی معنایی، هستی‌شناسی، معماری اطلاعات، نشر دیجیتال، شبکه‌های اجتماعی و پایگاه‌های اطلاعاتی برقرار نموده‌اند.

کلیدواژه‌ها


عنوان مقاله [English]

Identification of Topic Development Process of Knowledge and Information Science Field Based on the Topic Modeling (LDA)

نویسندگان [English]

  • Maryam Baghmohammad
  • Ali Mansouri
  • Mehrdad Cheashmehsohrabi
چکیده [English]

The purpose of this study is to explore the thematic trend analysis of Iranian articles in Library and Information Science based on Topic modeling (LDA) and linear regression model. The population of this study consists of 709 articles indexed in Scopus during 2008-2009. In order to achieve the research objectives, the data were analyzed using text mining algorithms, especially LDA thematic modeling algorithms using R software. The results showed that among the extracted topics, there are topics that have high research popularity and are considered as hot topics. These topics include library services on social media, research models, social capital, medical databases, data mining, scientific production trends, interdisciplinary studies, cyberspace algorithms, knowledge management, social media studies, research approaches, and future studies. Also, topics that are less popular and are considered as cold topics include areas such as electronic resources, information management system, search engines, book loan services, distance services, e-learning, e-government, journal evaluation indicators, evaluation of web resources, and digital libraries. The results indicated that Library and Information Science research in Iran has developed in line with the growth of technologies and global topics and has established the relationship between Library  and Information Science subject area and new fields of data mining, artificial intelligence, semantic retrieval, ontologies, information architecture, digital publishing, social networks, and databases.

کلیدواژه‌ها [English]

  • Topic Modeling
  • LDA
  • Trend Analysis
  • Hot Topic
  • Cold Topic
  • Log-likelihood
  • Knowledge and Information Science
  • text mining