دوره 35، شماره 2 - ( زمستان 1398 )                   جلد 35 شماره 2 صفحات 349-374 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Jafari Powersy H, Hariri N, Alipour-Hafezi M, Bab Al-Hawaiji F, Khademi M. Machine Indexing of Documents in the Field of Information Retrieval Using Text Mining in the RapidMiner Software. .... 2020; 35 (2) :349-374
URL: http://jipm.irandoc.ac.ir/article-1-4180-fa.html
جعفری پاورسی حمیده، حریری نجلا، علیپور حافظی مهدی، باب الحوائجی فهیمه، خادمی مریم. نمایه‌سازی ماشینی مدارک حوزه بازیابی اطلاعات با استفاده از متن‌کاوی در نرم‌افزار رپیدماینر. پژوهشنامه پردازش و مديريت اطلاعات. 1398; 35 (2) :349-374

URL: http://jipm.irandoc.ac.ir/article-1-4180-fa.html


؛ دانشگاه آزاد اسلامی؛ واحد علوم و تحقیقات؛ تهران، ایران؛
چکیده:   (1428 مشاهده)
سازگاری کدهای رده‏بندی و اصطلاحات نمایه‏سازی از یک اصطلاح‏نامه مدون با عبارات و کلماتی که به‏طور خودکار استخراج شده، با استفاده از نمایه ‏سازی ماشینی ایجاد می‏شود. در طراحی نظام نمایه‏سازی ‏خودکار، کامپیوتر به‏طور کامل جایگزین انسان می‏شود. این پژوهش با هدف اسـتخراج کلمـات کلیـدی و شناسایی گرایش‏های موضوعی مقالات نمونه آماری در حوزه بازیابی اطلاعات و تخصص موضوعی نویسنده هر مقاله با روش متن‏کاوی و دسته‏بندی آن‏ها با استفاده از هم‏رخدادی واژگان صورت گرفته است. روش این پژوهش از نوع کاربردی است و بر اساس مدل «کریسپ» از مدل‏های فرایند داده‏کاوی و الگوریتم ‏های متن‏ کاوی انجام گرفته است. جامعه پژوهش، 313 مقاله حوزه بازیابی اطلاعات نمایه‌شده در «پایگاه نورمگز» است. پس از نرمال‏سازی متن مقالات با نرم‏افزار ویراستیار، طی متن‏کاوی مقالات با نسخه 1/7 نرم‏افزار «رپیدماینر»، واژگان کلیدی از طریق محاسبه وزن آن‏ها استخراج و داده‏ها با استفاده از دو الگوریتم کلاسیک دسته ‏بندی یعنی «کی‏ان‏ان» و «نایو بیز» تجزیه و تحلیل شدند. در پژوهش حاضر، کامپیوتر با کمک ابزارهای متن‏کاوی نرم‏افزار «رپیدماینر»، متن ماشین‏ خوان را با استفاده از بسامد واژه‏ها به‏طور خودکار نمایه‏سازی کرده است. بدین‏منظور، با کمک عملگرهای «ان-گرام» و محاسبه وزن کلمات بر اساس روش «تی‏اف-آی‏دی‏اف»، اصطلاحات و مفاهیم کلیدی و تخصص موضوعی نویسنده هر مقاله در قالب 16 دسته ‏بندی استخراج شده است. سرانجام، برتری مدل «کی‏ان‏ان» در دسته ‏بندی موضوعات هسته مقالات این پژوهش با دقت 85 درصدی نسبت به مدل «نایو بیز» تأیید شد. مشاهده نتایج محاسبه دقت‏های مأخوذه از مدل‏ ها، گواه کارایی قابل‏ قبول نرم‏افزار «رپیدماینر» در نمایه‏سازی ماشینی متون است. نمایه‏ سازی متون با استفاده از این روش می‏تواند به بهبود نتایج بازیابی اطلاعات و جلوگیری از ریزش کاذب اطلاعات در پایگاه‏ های اطلاعاتی کمک کند.
متن کامل [PDF 1824 kb]   (613 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: كتابداري و اطلاع رساني
دریافت: 1397/11/21 | پذیرش: 1398/6/27 | انتشار: 1398/12/25

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


تمام حقوق این وب سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2020 All Rights Reserved | Iranian Journal of Information processing and Management

Designed & Developed by : Yektaweb