دوره 34، شماره 2 - ( زمستان 1397 )                   جلد 34 شماره 2 صفحات 871-896 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Soleimani Nezhad A, salajegheh M, Tayyebi Nia E. Clustering scientific articles based on the k_means algorithm Case Study: Iranian Research Institute for information Science and Technology (IranDoc). .... 2019; 34 (2) :871-896
URL: http://jipm.irandoc.ac.ir/article-1-3675-fa.html
سلیمانی نژاد عادل، سلاجقه مژده، طیبی الهام. خوشه‌بندی مقالات علمی بر پایه الگوریتم k_means مطالعه موردی: پایگاه پژوهشگاه علوم و فناوری اطلاعات ایران(ایرانداک). پژوهشنامه پردازش و مديريت اطلاعات. 1397; 34 (2) :871-896

URL: http://jipm.irandoc.ac.ir/article-1-3675-fa.html


دانشگاه شهید باهنر کرمان
چکیده:   (2086 مشاهده)
با رشد روزافزون منابع و مقالات در سطح وب، بهکارگیری روشهایی سریع و ارزان برای دسترسی به متون مورد نظر از میان مجموعه وسیع این مستندات، اهمیت بیشتری مییابد. برای رسیدن به این هدف، بهکارگیری تکنیکهای متنکاوی، گامی ارزشمند در جهت کشف دانش از مستندات متنی به شمار میرود. هدف اصلی این پژوهش خوشهبندی پایگاه «پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)» بر اساس فنون متنکاوی است تا مقالات موجود به چند خوشه تقسیم شوند؛ بهطوری که مقالات خوشههای مختلف حداکثر تفاوت ممکن و مقالات موجود در هر خوشه بیشترین شباهت را با هم داشته باشند. مقالات حوزههای مرتبط با فناوری اطلاعات انتخاب شدند. بدینمنظور، ابتدا تمام کلیدواژههای حوزههای فناوری اطلاعات بر اساس دفعات بسامد آنها در مقالات پایگاه انتخاب و سپس، مقالات هر کلیدواژه از پایگاه «ایرانداک» استخراج گردید. آنگاه، با استفاده از نرمافزار notepad++ مجموعه داده مورد نظر ایجاد گردید. در این پژوهش برای انجام خوشهبندی از الگوریتم k_means و از معیار تابع فاصله اقلیدسی برای اندازهگیری تشابه خوشهها استفاده گردید. سپس، نتایج حاصل از خوشهبندی مورد تجزیه و تحلیل قرار گرفت تا میزان شباهت و الگوی مناسب میان مقالات کشف شد. الگوی مورد نظر نشان داد که بیشترین میزان مشابهت میان مقالات دو خوشه دادهکاوی و شبکه عصبی با فاصله اقلیدسی 365/1 وجود دارد و کمترین میزان شباهت میان مقالات دو خوشه بهینهسازی و پردازش تصویر با فاصله 387/1 گزارش شده است. 
دانش حاصل از پژوهش عبارت است از: خوشهبندی مقالات مرتبط با بیشترین و کمترین میزان مشابهت با یکدیگر، یافتن الگوی جدید جهت دسترسی سریع و آسان به مقالات مشابه، و کشف ارتباط پنهان میان موضوعات مختلف. این دانش به پژوهشگران کمک میکند که بتوانند مقالات موضوعی مرتبط با تخصص خود و مشابه با موضوع مورد مطالعه را به نحوی مطلوبتر شناسایی کنند.
متن کامل [PDF 2258 kb]   (778 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: فناوري اطلاعات
دریافت: ۱۳۹۶/۴/۲۸ | پذیرش: ۱۳۹۶/۱۲/۲۸ | انتشار: ۱۳۹۷/۲/۴

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


تمام حقوق این وب سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2019 All Rights Reserved | Iranian Journal of Information processing and Management

Designed & Developed by : Yektaweb