مطالعه نفوذ مقالات علمی در متون اجتماعی با تحلیل شباهت واژگانی و شاخص‌‌های دگرسنجی در قلمرو موضوعی تغییرات آب‌و‌هوا

نویسندگان

1 مرکز منطقه‌ای اطلاع‌رسانی علوم و فناوری؛ شیراز؛ ایران

2 دانشگاه خوارزمی ؛تهران؛ ایران

3 دانشگاه شاهد؛ تهران ؛ ایران

4 دانشگاه یزد؛ یزد؛ ایران

5 دانشگاه شیراز ؛شیراز؛ ایران

چکیده

مسئله پژوهش حاضر، مطالعه متون علمی و متون اجتماعی نظیر آنها، با هدف بررسی نفوذ استنادی و نفوذ اصطلاحات متون علمی در متون اجتماعی است. انتظار می‏رود، متن اجتماعی به وسیله استناد به متون علمی پلی باشد بین دانشمندان و کاربران فضای اجتماعی تا بتوان به کمک پردازش ‌واژگان هر یک از متون علمی و اجتماعی و سنجش شباهت آنها به کمک شاخص دربردارندگی، میزان نفوذ واژگانی یا نفوذ علم در اجتماع را، مشاهده نمود. اساس داده های آماری پژوهش حاضر را، مقالات علمی حوزه موضوعی تغییرات آب و هوا منتشر شده در مجلات تحت پوشش پایگاه وب علوم تشکیل می­دهد، که نقش جامعه پژوهش را دارند. اعضای نمونه شامل 9876 متن علمی و اجتماعی (7912 متن اجتماعی استناد کننده به 1964 متن علمی) که به کمک کد پایتون و بسته سوپ زیبا از محیط وب، استخراج و در قالب فایل‌های .txt ذخیره گردید. فایل­های pdf به صورت دستی استخراج و به فایل txt تبدیل شدند. با استفاده از مدل نمایه­سازی خودکار شکاف و زبان عبارات الگودار، اصطلاحات نمایه­سازی شده متون علمی و اجتماعی و اصطلاحات مشترک میان آنها، مشخص و بر اساس طول آنها و به تفکیک نوع مدارک اجتماعی، دسته­بندی شدند. سنجش میزان نفوذ با استفاده از شاخص دربردارندگی، نشان داد که میانگین شدت نفوذ برابر با 27 درصد است. همبستگی مثبت، معنادار و قوی (76/0) بین تعداد اصطلاحات مشترک و شدت نفوذ علمی وجود دارد. نتایج آزمون مجذور کا نیز، نشان داد که رابطه معناداری در سطح 1% بین تعداد واژگان اصطلاح (طول اصطلاح) و شدت نفوذ، وجود دارد. همچنین بین سطح شدت نفوذ و نوع مدارک اجتماعی اعم از خبر، وبلاگ، اسناد سیاست‌گذاری، ویکی‌پدیا و متن داوری­ها، تفاوت وجود دارد. بیشترین درصد نفوذپذیری مربوط به اسناد سیاست‌گذاری و سپس ویکی‌پدیا است. کسب 22 استناد علمی و 40 استناد اجتماعی به طور میانگین برای هر مقاله، و همبستگی قوی میان استناد و نمره آلتمتریک، نشان دهنده نفوذ استنادی مقالات در میان جامعه دانشگاهی و غیردانشگاهی است. در مجموع می­توان از قدرت دگرسنجه­هایی چون اسناد سیاست‌گذاری، ویکی‌پدیا و وبلاگ­ها و نفوذپذیری واژگانی آنها، جهت ترویج هرچه بیشتر و بهتر یافته­های علمی استفاده نمود و با نشر علم در این منابع حتی با زبانی متفاوت از زبان نگارش نویسندگان، به آگاهی بیشتر جامعه و عموم مردم، کمک نمود.

کلیدواژه‌ها


عنوان مقاله [English]

Studying the Influence of Scientific Articles on Social Texts Using Word Similarity Analysis and Altmetrics in the Field of Climate Change

نویسندگان [English]

  • Forough rahimi 1
  • Nosrat Riahinia 2
  • Hamzehali Nourmohammadi 3
  • Mohammad TavakoliZadeh-Ravari 4
  • Hajar Sotudeh 5
چکیده [English]

The present survey aims to study the scientific texts and social texts linked each other by citations in order to investigate the influence of scientific terms on social texts. The social text is expected to be a bridge between scholars and users by citing scientific texts. By indexing scientific and social text and measuring its similarity by means of an inclusion index, it is possible to see the influence of scientific terms on social texts. The basis of the statistical data of the present study is the scientific papers on climate change issues published in the journals covered by the Web of Science, which have the role of the research community. Sample members consisted of 9876 scientific and social texts (7912 social texts cited 1964 scientific texts) that were extracted and stored in .txt files with the help of Python web scraping using beautiful soup package. The pdf files were extracted manually and converted to a txt file. The indexed terms of the scientific and social texts and the common terms between them, were identified and categorized according to their length and document types separately using the automatic negative indexing model and regular expressions. Measuring the penetration of scientific terms on social texts using the inclusion index, showed that the average penetration rate was 27%. There was a positive, significant and strong correlation (0.76) between the number of common terms and academic penetration. The results of chi-square test showed that there is a significant relationship at 1% level between the term length and the average penetration rate. There is also a difference between the level of penetration and the type of social documents type, including news, blogs, policy documents, Wikipedia, and peer reviews. The highest percentage of penetration is related to policy documents and then Wikipedia. Obtaining 22 citations and 40 social citations on average per paper, and the strong correlation between citation and altmetric score, indicates the citation influence among the academic and non-academic community. Collectively, with the power of altmetrics like policy documents, Wikipedia and blogs and their permeability, they can be used to further promote scientific findings. Publishing scientific findings in these sources, even in a different language from scientific authors, can contributed to greater awareness of society and the general public.

کلیدواژه‌ها [English]

  • Altmetrics
  • citation
  • Inclusion index
  • Scientific Influence
  • Lexical similarity