XML English Abstract Print


دانشگاه شهید باهنر کرمان
چکیده:   (819 مشاهده)
با رشد روز افزون منابع و مقالات در سطح وب، بکارگیری روش‌هایی سریع و ارزان برای دسترسی به متون مورد نظر از میان مجموعه وسیع این مستندات، اهمیت بیشتری می‌یابد. برای رسیدن به این هدف، به کارگیری تکنیک‌های متن کاوی، گامی ‌ارزشمند در جهت کشف دانش از مستندات متنی به شمار می‌رود. هدف اصلی این پژوهش خوشه‌بندی پایگاه پژوهشگاه علوم و فناوری اطلاعات ایران(ایرانداک) براساس فنون متن کاوی می‌باشد. تا مقالات موجود به چند خوشه تقسیم شوند بطوریکه مقالات خوشه های مختلف حداکثر تفاوت ممکن و مقالات موجود در هر خوشه بیشترین شباهت را با هم داشته باشند. مقالات حوزه های مرتبط با فن آوری اطلاعات انتخاب شدند. بدین منظور ابتدا تمام کلید واژه های حوزه های فن آوری اطلاعات بر اساس دفعات بسامد آنها در مقالات پایگاه انتخاب و سپس مقالات هر کلیدواژه از پایگاه ایران داک استخراج گردید. سپس با استفاده از نرم افزار notepad++ مجموعه داده موردنظر ایجاد گردید. در این پژوهش برای انجام خوشه‌بندی از الگوریتم k_means و از معیار تابع فاصله اقلیدسی[1] برای اندازه‌گیری تشابه خوشه‌ها استفاده گردید. سپس نتایج حاصل از خوشه‌بندی مورد تجزیه و تحلیل قرار گرفت تا میزان شباهت و الگوی مناسب میان مقالات کشف شد. الگوی مورد نظر نشان داد که بیشترین میزان مشابهت میان مقالات دو خوشه داده‌کاوی و شبکه عصبی با فاصله اقلیدسی 365/1 وجود دارد و کمترین میزان شباهت میان مقالات دو خوشه بهینه‌سازی و پردازش تصویر با فاصله 387/1 گزارش شده است.
دانش حاصل از پژوهش، خوشه‌بندی مقالات مرتبط با بیشترین وکمترین میزان مشابهت با یکدیگر، یافتن الگوی جدید جهت دسترسی سریع و آسان به مقالات مشابه و کشف ارتباط پنهان میان موضوعات مختلف می باشند.این دانش به پژوهشگران کمک می‌کند تا بتوانند مقالات موضوعی مرتبط با تخصص خود و مشابه با موضوع مورد مطالعه را به نحوی مطلوب تر شناسایی کنند.
 
[1] -Euclidean distance
متن کامل [PDF 1189 kb]   (242 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: فناوري اطلاعات
دریافت: ۱۳۹۶/۴/۲۸ | پذیرش: ۱۳۹۶/۱۲/۲۸ | انتشار: ۱۳۹۷/۲/۴

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA code

ارسال پیام به نویسنده مسئول


تمام حقوق این وب سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2018 All Rights Reserved | Iranian Journal of Information processing and Management

Designed & Developed by : Yektaweb