بررسی میزان تطابق زبان نمایه‌سازان، نویسندگان و برچسب‌گذاران در پایگاه اطلاعاتی اریک و مندلی

نویسندگان

1 گروه علم اطلاعات و دانش ‌شناسی؛ دانشکده مدیریت؛ دانشگاه تهران

2 گروه علم اطلاعات و دانش ‌شناسی؛ دانشکده مدیریت؛ دانشگاه تهران؛

3 گروه علم اطلاعات و دانش‌ شناسی؛ دانشکده مدیریت؛ دانشگاه تهران

4 پژوهشگاه علوم و فناوری اطلاعات ایران(ایرانداک)

چکیده

هدف این پژوهش شناسایی میزان تطابق زبان نمایه‏‌سازان، نویسندگان و برچسب‌‏گذاران در پایگاه‌های اطلاعاتی «اریک» و «مندلی» است. این پژوهش از نوع کاربردی است که برای انجام آن از روش تحلیل محتوا استفاده شده است. جامعه مورد مطالعه در این پژوهش شامل 499 مقاله از 20 مجله حوزه علوم تربیتی است که در سال 2014 در پایگاه اطلاعاتی «اریک» نمایه‌‏سازی شده بودند. برچسب‏‌های تخصیص داده‌شده در فاصله زمانی از اول ژانویه سال 2014 تا سوم اوت سال 2016 از وبگاه «مندلی» استخراج گردید. کلیدواژه‌‏های تخصیص داده‌شده به مقاله‏ها توسط نویسندگان‏ آن‌ها، از خود مقاله‌‏ها استخراج گردید. داده‏‌های گردآوری‌شده برای بررسی میزان تطابق این سه زبان با استفاده از برنامه‏‌ای به ‌زبان برنامه‏نویسی شیء‏گرا «سی‌شارپ» مورد تجزیه و تحلیل قرار گرفت. همچنین، به‌منظور مشخص‌شدن میانگین‌‏ها و فراوانی‏‌ها از آمار توصیفی استفاده شد و برای تحلیل و ارزیابی داده‏‌ها نرم‏‌افزار «اکسل» 2013 به‌کار گرفته شد. یافته‌ها نشان می‏‌دهد که میزان تطابق کلیدواژه‌های تخصیص داده‌شده توسط نویسندگان مدارک با برچسب‏‌های تخصیص داده‌شده توسط برچسب‏گذاران به همان مدارک در وبگاه «مندلی» 15 درصد، میزان تطابق توصیف‌گرهای تخصیص داده‌شده توسط نمایه‏‌سازان به مدارک در پایگاه «اریک» با برچسب‌‏های تخصیص داده‌شده توسط برچسب‏‌گذاران به همان مدارک در وبگاه «مندلی» 3 درصد، میزان تطابق توصیف‌گرهای تخصیص داده‌شده توسط نمایه‏‌سازان به مدارک در پایگاه «اریک» با کلیدواژه‌های تخصیص داده‌شده توسط نویسندگان به همان مدارک 4 درصد، و در نهایت، میزان تطابق هر سه زبان مورد مطالعه 1/1 درصد بود. همچنین، میزان حضور توصیفگرهای تخصیص داده‌شده توسط نمایه‏سازان در اصطلاح‌نامه «اریک» 34 درصد بود که از دو گروه نویسنده و برچسب‏‌گذار بیشتر است. یافته‌‏ها نشان داد که تطابق بیشتری بین واژگان و زبان نویسنده و برچسب‌‏گذار نسبت به تطابق بین واژگان و زبان نمایه‏‌ساز و برچسب‌‏گذار و همچنین، تطابق بین واژگان و زبان نویسنده و نمایه‏‌ساز وجود دارد. نتایج این پژوهش نشان داد که برچسب‏‌گذاران واژه‏‌هایی متفاوت از توصیف‌گر‏های نمایه‏‌سازان و کلیدواژه‌‏های نویسندگان استفاده کرده‌‏اند، و این نشان‌دهنده عدم آشنایی سه گروه «نمایه‏‌ساز، نویسنده و برچسب‏‌گذار» به زبان و واژگان مورد استفاده همدیگر است. پیشنهاد می‏شود که به‌منظور جست‌وجوی سودمند و بازیابی اطلاعات در نظام‏‌های سنتی نمایه‏‌سازی در هنگام کنترل واژه‌‏ها و هم‌ارایی واژه‏‌ها (پیش‏همارا و پس‏همارا) زبان کاربر و نویسنده مورد توجه قرار گیرد.

کلیدواژه‌ها


عنوان مقاله [English]

Consistency between Descriptors, Author-Supported Keywords and Tags in the ERIC and Mendeley Database

نویسندگان [English]

 • Maryam Ghanavati 1
 • Alireza Noruzi 2
 • Maryam Nakhoda 3
 • Ashkan Khatir 4
1
2
3
4
چکیده [English]

The purpose of this study was to identify the language consistency between indexers, authors and taggers in the ERIC and Mendeley databases.
This survey was conducted using content analysis methods and techniques to evaluate the language consistency between indexers, authors and taggers in the ERIC and Mendeley databases and also to determine common keywords. The sample for this study was comprised of top twenty journals in the field of Educational Research based on the Journal Citation Reports (JCR) of Web of Science, indexed in the ERIC database in 2014. Finally 499 articles published in the above-mentioned journals in 2014 were chosen as the sample base for the dataset. Note that only articles with author-supported keywords, indexed in the ERIC database and also tagged in the Mendeley database from January 2014 to August 2016 were eligible to be assessed. Descriptors assigned to the articles on the ERIC database and tags associated to the articles on the Mendeley database for the period from January 2014 to August 2016 were extracted. Also author-assigned keywords assigned to all 499 articles were collected. Finally we created a software based on object-oriented programming (OOP) in C++ to analyze the search results. Descriptive statistics and measures, and thesaural term comparison show that there are important differences in the context of keywords from the three groups.
This study demonstrated that there were differences between the tagger, author and professional indexer views of the words used as tags, descriptors, or author-assigned keywords. The results showed that the consistency between the author-supported keywords and user tags of the 499 articles in the Mendeley was 15 percent; while the consistency between descriptors designated to the articles in the ERIC database and user tags associated to the articles on the Mendeley were three percent. On the other hand, the consistency between descriptors assigned to the articles in the ERIC database and the author-assigned keywords were 4 percent. Finally, the language consistency between the three above-mentioned groups was 1.1 percent. Also note that the presence of descriptors in the ERIC thesaurus was 34 percent, which were more than the author-supported keywords and tags.
The findings showed that the consistency between the keywords used by authors and taggers were more than the keywords chosen by indexers and authors, and by indexers and taggers. This means that three sides of the information representation triangle, i.e., indexer, author and tagger are unfamiliar with each other’s language. It is worth noting that tags are useful supplements to controlled vocabularies, since the former provide a means for social organization of knowledge outside the framework of the latter. The low consistency between tags and descriptors in this research indicates that Mendeley users do not use the same terminology as subject specialists who maintain descriptors in the ERIC thesaurus. Further research involving semantic analysis of Mendeley tags may reveal an emerging vocabulary suitable for inclusion in the ERIC thesaurus as a controlled vocabulary.

کلیدواژه‌ها [English]

 • Collaborative Tagging
 • Social Indexing
 • Social Classification
 • knowledge organization
 • ERIC
 • Mendeley
 • Folksonomies
 • Controlled vocabulary