دوره 37، شماره 4 - ( تابستان 1401 )                   جلد 37 شماره 4 صفحات 1245-1268 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Pakniat N, Nasiri J A. A Persian Citation Parsing Method Using Support Vector Machine. .... 2022; 37 (4) :1268-1245
URL: http://jipm.irandoc.ac.ir/article-1-4700-fa.html
پاک‌نیت نصراله، نصیری جلال‌الدین. تجزیه متون استنادی در زبان فارسی با استفاده از ماشین بردار پشتیبان. پژوهشنامه پردازش و مديريت اطلاعات. 1401; 37 (4) :1245-1268

URL: http://jipm.irandoc.ac.ir/article-1-4700-fa.html


پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)، تهران؛ ایران.
چکیده:   (724 مشاهده)
یک متن استنادی را می‌توان به عنوان مجموعه‌ای از مولفه‌ها مانند نام نویسندگان، عنوان، محل نشر، سال نشر، شماره صفحات و ... در نظر گرفت. در حالیکه تجزیه متون استنادی موجود در انتهای یک مدرک علمی توسط کاربر انسانی به راحتی انجام‌پذیر است، تنوع موجود در شیوه‌های استناددهی در کنار اشتباهات رخ داده توسط نویسندگان در نگارش این متون، خودکارسازی انجام این عملیات را دشوار نموده است. روش‌های زیادی برای خودکارسازی تجزیه متون استنادی ارائه شده اما، این روش‌ها وابسته به زبان بوده و امکان استفاده از یک روش ارائه شده برای یک زبان در زبانی دیگر منجر به نتایجی اشتباه می‌شود. تحقیقات صورت گرفته بیان‌گر این است که تاکنون هیچ روشی برای خودکارسازی تجزیه متون استنادی در زبان فارسی ارائه نشده است. با توجه به این مهم و نقش گسترده این مسئله در ساخت خودکار شبکه‌های استنادی مدارک علمی و فرایندهای بازیابی اطلاعات، در این مقاله به این مسئله پرداخته شده و با استفاده از روش یادگیری ماشین بردار پشتیبان به عنوان یک دسته‌بند چند دسته‌ای، یک روش هوشمند برای مسئله تجزیه متون استنادی در زبان فارسی ارائه شده است. با توجه به اهمیت انتخاب ویژگی‌های مناسب برای استفاده در دسته‌بند ماشین بردار پشتیبان، در این پژوهش این مهم با توجه به ویژگی‌های استفاده شده در زبان انگلیسی و ویژگی‌های زبان فارسی و ارجاع‌دهی در این زبان انجام شده است. نتایج پیاده‌سازی و آزمایش روش پیشنهادی با استفاده از مجموعه داده‌ای ایجاد شده در این پژوهش نشانگر مقدار ۰.۹۵ برای پارامترهای دقت، فراخوانی و اف-۱ است.
متن کامل [PDF 1894 kb]   (182 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: سازمان‌دهی
دریافت: 1400/2/8 | پذیرش: 1400/2/28 | انتشار: 1401/4/1

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

تمام حقوق این وب‌سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات است.

طراحی و برنامه‌نویسی: یکتاوب افزار شرق

© 2022 CC BY-NC 4.0 | Iranian Journal of Information processing and Management

Designed & Developed by: Yektaweb