دوره 35، شماره 2 - ( زمستان 1398 )                   جلد 35 شماره 2 صفحات 553-574 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Shokouhian M, Asemi A, Shabani A, Cheshmesohrabi M. Presenting a Thematic Model of Health Scientific Productions Using Text-Mining Methods. .... 2020; 35 (2) :553-574
URL: http://jipm.irandoc.ac.ir/article-1-4307-fa.html
شکوهیان محبوبه، عاصمی عاصفه، شعبانی احمد، چشمه سهرابی مظفر. ارائه مدل دسته‌بندی موضوعی تولیدات علمی حوزه سلامت با استفاده از روش‌های متن‌کاوی. پژوهشنامه پردازش و مديريت اطلاعات. 1398; 35 (2) :553-574

URL: http://jipm.irandoc.ac.ir/article-1-4307-fa.html


گروه علم اطلاعات و دانش شناسی؛ دانشگاه اصفهان و دکتری بیزینس اینفورماتیک ، دانشگاه کروینوس بوداپست
چکیده:   (1031 مشاهده)
با گسترش اینترنت و رشد سریع و روزافزون مقالات الکترونیکی، دسته‌بندی متون به یکی از ابزارهای کلیدی و مهم برای سازماندهی و مدیریت داده تبدیل‌شده است. در دسته­بندی متون، یک مجموعه دانش اولیه در اختیار سامانه قرار می‌گیرد تا با یادگیری از این مجموعه، اسناد جدید ورودی به یکی از گروه‌های موضوعی، ملحق گردد. در متون سلامت به علت تنوع زیاد موضوعات، آماده کردن چنین مجموعه آموزش اولیه عملی بسیار زمان­بر و هزینه­بر است. هدف از مقاله ارائه مدلی ترکیبی از یادگیری (با نظارت و بدون نظارت) برای دسته‌بندی موضوعی تولیدات علمی حوزه سلامت است که بدون نیاز به مجموعه برچسب خورده اولیه عمل دسته­بندی را انجام ­دهد. برای استخراج مدل موضوعی متون تولیدات علمی سلامت طی سال‌های 2009 تا 2019 در پایگاه پابمد، با استفاده از روش آمیخته داده‌کاوی، شامل متن‌کاوی و یادگیری ماشینی انجام گرفت. بر اساس مدل موضوعی تخصیص پنهان دیریکله، دادها تحلیل و سپس برای دسته‌بندی متون، از مدل ماشین بردار پشتیبان استفاده شد. در یافته‌های این پژوهش، مدل دسته‌بندی متون سلامت در سه‌گام اصلی معرفی شد. در گام اول پیش‌پردازش‌های لازم بر روی مجموعه داده به دلیل حذف کلمات کم تکرار و غیرضروری از مجموعه داده و افزایش دقت مدل پیشنهادی انجام گرفت. در گام دوم موضوعات موجود در متون به کمک روش احتمالاتی تخصیص پنهان دیریکله استخراج و به‌عنوان یک مجموعه آموزش اولیه در گام سوم به الگوریتم دسته‌بندی ماشین بردار پشتیبان داده و عمل یادگیری دسته‌بند به کمک این موضوعات انجام گرفت. درنهایت به کمک دسته‌بند، موضوع هر سند مشخص گردید. نتایج نشان داد که مدل پیشنهادی می‌تواند، یک دسته‌بندی بهتر با استفاده از ترکیب کردن خواص بدون نظارت خوشه‌بندی و دانش پیشین نمونه‌ها بسازد. انجام دادن خوشه‌بندی روی نمونه‌های برچسب دار با یک معیار شباهت مشخص، متن‌های مرتبط را باهم ادغام و یک دانش پیشین ایجاد کرده، سپس الگوریتم یادگیری، دسته‌بندی را با روشی نظارتی آموزش می‌دهد. ترکیب دسته‌بندی و خوشه‌بندی می‌تواند دقت دسته‌بندی متون سلامت را افزایش دهد.
متن کامل [PDF 1644 kb]   (319 دریافت)    
نوع مطالعه: پژوهشي |
دریافت: 1398/5/9 | پذیرش: 1398/6/6 | انتشار: 1398/12/25

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


تمام حقوق این وب سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2020 All Rights Reserved | Iranian Journal of Information processing and Management

Designed & Developed by : Yektaweb