دوره 36، شماره 2 - ( زمستان 1399 )                   جلد 36 شماره 2 صفحات 563-592 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

kalantari A, Jowkar A, Fakhrahmad S M, Abbaspour J, Sotudeh H, Mortazavi M, et al . Keyword and Phrase Extraction from Persian Texts: A Review of the literature. .... 2020; 36 (2) :563-592
URL: http://jipm.irandoc.ac.ir/article-1-4350-fa.html
کلانتری عاطفه، جوکار عبدالرسول، فخراحمد سید مصطفی، عباس پور جواد، ستوده هاجر، مرتضوی نصرآباد مسعود، و همکاران.. استخراج کلمات و عبارات کلیدی از متون فارسی(مروری بر پژوهش‌های صورت گرفته ). پژوهشنامه پردازش و مديريت اطلاعات. 1399; 36 (2) :563-592

URL: http://jipm.irandoc.ac.ir/article-1-4350-fa.html


دانشگاه شیراز؛ شیراز، ایران؛ مسئول کتابخانه دانشکده پرستاری و مامایی؛ دانشگاه علوم پزشکی قزوین؛ قزوین، ایران؛
چکیده:   (1239 مشاهده)
استخراج کلمات/ عبارات کلیدی متن، پیش‏‏نیاز بسیاری دیگر از وظایف حوزه پردازش زبان طبیعی است. اما بررسی متون فارسی و انگلیسی این حوزه نشان ‏میدهد که تلاش‏های انگشت‏شماری برای استخراج کلمات/ عبارات کلیدی از متون فارسی صورت‏گرفته ‏است. ازاینرو، این مقاله ‏با هدف تعیین موقعیت کنونی پردازش زبان طبیعی فارسی، و ‏به‏طور خاص، استخراج کلمات/ عبارات کلیدی از متون فارسی ‏به‏ مرور خلاصه‏‏‏‏ای ‏از مقالات فارسی و انگلیسی منتشر‏شده در این حوزه که از متون فارسی برای آزمودن ایده‏ها استفاده کرده‏‏‏اند‏، ‏می‏پردازد. سپس، هر مقاله را از نظر روش‏‏شناسی، نحوه اجرا و ‏پیاده‏سا‏‏زی، روش ارزیابی، و معیارهای آن مورد تعمق قرار داده و به چالش ‏می‏کشد.
در مجموع، 14 مقاله فارسی و 6 مقاله انگلیسی به استخراج کلمات و عبارات کلیدی از متون فارسی پرداخته‏اند‏. روش بیشتر این مقالات استفاده از اطلاعات آماری و ‏زبان‏‏‏شناختی بوده ‏است. اکثر این مقالات یا در روش‏شناسی انتخاب‏شده ایراد دارند و یا نویسندگان نتوانسته‏اند‏ ایده پیشنهادی خود را ‏به‏وضوح برای خواننده تبیین نمایند. ‏در بسیاری از مقالات از مجموعه داده استانداردی برای ارزیابی سیستم استفاده نشده و نحوه محاسبه معیارهای ارزیابی مبهم یا دارای اشکال است.
در مجموع، ‏بهجز 3 مقاله که روش اجرا‏شده را ‏به‌‌نحو نسبتاً قابل‏قبولی گزارش کرده‏اند‏، سایر مقالات قابلیت تکرار‏پذیری و تعمیم ندارند. این است که نمی‏توان از آنها ‏به‏عنوان معیار پایه‏‏ای ‏برای ارزیابی سیستم‏های آینده استفاده کرد یا از ایده مطرح‏شده در آنها با اطمینان در ساخت و توسعه نرم‏افزارهای کاربردی و عملی در حوزه استخراج کلمات کلیدی استفاده نمود.
متن کامل [PDF 784 kb]   (655 دریافت)    
نوع مطالعه: مروري |
دریافت: 1398/7/18 | پذیرش: 1399/3/25 | انتشار: 1399/10/21

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


تمام حقوق این وب سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2021 CC BY-NC 4.0 | Iranian Journal of Information processing and Management

Designed & Developed by : Yektaweb