[صفحه اصلی ]   [Archive] [ English ]  
irandoc irandoc irandoc irandoc irandoc
:: ::
برگشت به فهرست مقالات برگشت به فهرست نسخه ها
خوشه‌بندی مقالات علمی بر پایه الگوریتم k_means مطالعه موردی: پایگاه پژوهشگاه علوم و فناوری اطلاعات ایران(ایرانداک)(97/02/04)
عادل سلیمانی نژاد ، مژده سلاجقه، الهام طیبی
استادیار دانشگاه شهید باهنر کرمان
چکیده:   (510 مشاهده)
با رشد روز افزون منابع و مقالات در سطح وب، بکارگیری روش‌هایی سریع و ارزان برای دسترسی به متون مورد نظر از میان مجموعه وسیع این مستندات، اهمیت بیشتری می‌یابد. برای رسیدن به این هدف، به کارگیری تکنیک‌های متن کاوی، گامی ‌ارزشمند در جهت کشف دانش از مستندات متنی به شمار می‌رود. هدف اصلی این پژوهش خوشه‌بندی پایگاه پژوهشگاه علوم و فناوری اطلاعات ایران(ایرانداک) براساس فنون متن کاوی می‌باشد. تا مقالات موجود به چند خوشه تقسیم شوند بطوریکه مقالات خوشه های مختلف حداکثر تفاوت ممکن و مقالات موجود در هر خوشه بیشترین شباهت را با هم داشته باشند. مقالات حوزه های مرتبط با فن آوری اطلاعات انتخاب شدند. بدین منظور ابتدا تمام کلید واژه های حوزه های فن آوری اطلاعات بر اساس دفعات بسامد آنها در مقالات پایگاه انتخاب و سپس مقالات هر کلیدواژه از پایگاه ایران داک استخراج گردید. سپس با استفاده از نرم افزار notepad++ مجموعه داده موردنظر ایجاد گردید. در این پژوهش برای انجام خوشه‌بندی از الگوریتم k_means و از معیار تابع فاصله اقلیدسی[1] برای اندازه‌گیری تشابه خوشه‌ها استفاده گردید. سپس نتایج حاصل از خوشه‌بندی مورد تجزیه و تحلیل قرار گرفت تا میزان شباهت و الگوی مناسب میان مقالات کشف شد. الگوی مورد نظر نشان داد که بیشترین میزان مشابهت میان مقالات دو خوشه داده‌کاوی و شبکه عصبی با فاصله اقلیدسی 365/1 وجود دارد و کمترین میزان شباهت میان مقالات دو خوشه بهینه‌سازی و پردازش تصویر با فاصله 387/1 گزارش شده است.
دانش حاصل از پژوهش، خوشه‌بندی مقالات مرتبط با بیشترین وکمترین میزان مشابهت با یکدیگر، یافتن الگوی جدید جهت دسترسی سریع و آسان به مقالات مشابه و کشف ارتباط پنهان میان موضوعات مختلف می باشند.این دانش به پژوهشگران کمک می‌کند تا بتوانند مقالات موضوعی مرتبط با تخصص خود و مشابه با موضوع مورد مطالعه را به نحوی مطلوب تر شناسایی کنند.
 
[1] -Euclidean distance
واژه‌های کلیدی: متن کاوی، خوشه‌بندی، الگوریتم k_means، معیار تابع فاصله اقلیدسی، پایگاه ایران داک
متن کامل [PDF 1189 kb]   (139 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: فناوري اطلاعات
دریافت: ۱۳۹۶/۴/۲۸ | پذیرش: ۱۳۹۶/۱۲/۲۸ | انتشار: ۱۳۹۷/۲/۴
ارسال پیام به نویسنده مسئول

ارسال نظر درباره این مقاله
نام کاربری یا پست الکترونیک شما:

CAPTCHA code


XML   English Abstract   Print



برگشت به فهرست مقالات برگشت به فهرست نسخه ها
پژوهشنامه پردازش و مدیریت اطلاعات Journal of Information processing and Management
1cd1b69edf77ec3
نقشه پايگاه | پرسش‌هاي متداول | اطلاع‌رساني به دوستان | آمار پايگاه | حقوق | مسئوليت محتوا | روزآوري: ۱۳۹۷/۶/۳۱
كليه حقوق براي فصل‌نامه پردازش و مديريت اطلاعات محفوظ است.
Persian site map - English site map - Created in 0.28 seconds with 36 queries by YEKTAWEB 3749