دوره 34، شماره 4 - ( تابستان 98 1398 )                   جلد 34 شماره 4 صفحات 1823-1848 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Pakniat N, Mohebi A. Detecting Similarity in Paraphrased Persian Texts using Semantic and Probabilistic Methods. .... 2019; 34 (4) :1823-1848
URL: http://jipm.irandoc.ac.ir/article-1-3883-fa.html
پاک‌نیت نصراله، محبی آزاده. همانندجویی در متون فارسی بازنویسی شده با استفاده از روش‌های معنایی و احتمالاتی. پژوهشنامه پردازش و مديريت اطلاعات. 1398; 34 (4) :1823-1848

URL: http://jipm.irandoc.ac.ir/article-1-3883-fa.html


پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)
چکیده:   (2401 مشاهده)
همانندجویی ابزاری است که از آن برای تشخیص سرقت علمی/ ادبی استفاده میشود. هدف در یک روش همانندجویی، تشخیص تمام قسمتهای همانندِ موجود در یک متن مشکوک با توجه به تعدادی متن منبع احتمالی است. روشهای زیادی برای همانندجویی ارائه شده، اما از یک طرف، استفاده از روشهای همانندجوی موجود برای سایر زبانها بهمنظور همانندجویی در زبان فارسی مناسب نیست و از طرف دیگر، اغلب روشهای ارائهشده برای همانندجویی در زبان فارسی قادر به تشخیص متون بازنویسیشده نیستند. با توجه به این مهم، در این مقاله دو روش همانندجویی جدید با هدف تشخیص متون فارسی بازنویسیشده ارائه خواهد شد. روششناسی پژوهش بر اساس مطالعه منابع و مستندات معتبر علمی در این خصوص و روش کتابخانهای است. روش اولِ پیشنهادی روشی معنایی است و از لغتنامه جهت بررسی همانندی جملات متون استفاده میکند. روش دومِ پیشنهادی روشی احتمالاتی است و از اطلاعات آماری بهدستآمده از پیکرهای عظیم از متون برای همانندجویی استفاده میکند. روش معناییِ پیشنهادی در مقایسه با روشهای معنایی موجود از معیارهای جدیدتری برای بررسی همانندی متون استفاده کرده و روش احتمالاتی پیشنهادی اولین روش همانندجویی احتمالاتی ارائهشده برای زبان فارسی است. علاوه بر این، در حالی که در سایر روشهای موجود، همانندی هر دو جمله از متون مورد نظر بهصورت مستقل بررسی میشود، در روشهای پیشنهادی همانندی جملات همسایه نیز در بررسی همانندی دو جمله در نظر گرفته شده است. نتایج پیادهسازی و آزمایشات صورتگرفته بر روی روشهای پیشنهادی نشان میدهد که در حالی که هر دو روش از کیفیت مناسب و تقریباً یکسانی برخوردار هستند، روش همانندجوی احتمالاتیِ پیشنهادی بسیار کاراتر بوده و زمان مورد نیاز برای همانندجویی با استفاده از آن بهطور متوسط برابر با 8/3 درصد زمان مورد نیاز توسط الگوریتم همانندجوی معناییِ پیشنهادی است.
متن کامل [PDF 945 kb]   (790 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: موضوع سطح چهارم
دریافت: 1396/12/13 | پذیرش: 1397/6/24 | انتشار: 1398/7/7

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


تمام حقوق این وب سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2020 All Rights Reserved | Iranian Journal of Information processing and Management

Designed & Developed by : Yektaweb