XML English Abstract Print


پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)
چکیده:   (159 مشاهده)
همانندجویی ابزاری است که از آن برای تشخیص سرقت علمی/ادبی استفاده می‌شود. در یک روش همانندجویی، هدف تشخیص تمام قسمت‌های همانند موجود در یک متن مشکوک با توجه به تعدادی متن منبع احتمالی است. روش‌های زیادی برای همانندجویی ارائه شده اما از یک طرف، استفاده از روش‌های همانندجوی موجود برای سایر زبان‌ها به منظور همانندجویی در زبان فارسی مناسب نیست و از طرف دیگر، اغلب روش‌های ارائه شده برای همانندجویی در زبان فارسی قادر به تشخیص متون بازنویسی شده نیستند. با توجه به این مهم، در این مقاله دو روش همانندجویی جدید با هدف تشخیص متون فارسی بازنویسی شده ارائه خواهد شد. روش‌شناسی پژوهش براساس مطالعه منابع و مستندات معتبر علمی در این خصوص و روش کتابخانه‌ای است. روش اول پیشنهادی روشی معنایی است و از لغت‌نامه جهت بررسی همانندی جملات متون استفاده می‌کند. روش دوم پیشنهادی روشی احتمالاتی است و از اطلاعات آماری به دست آمده از پیکره‌ای عظیم از متون برای همانندجویی استفاده می‌کند. روش معنایی پیشنهادی در مقاسیه با روش‌های معنایی موجود از معیارهای جدیدتری برای بررسی همانندی متون استفاده کرده و روش احتمالاتی پیشنهادی اولین روش همانندجویی احتمالاتی ارائه شده برای زبان فارسی است. علاوه بر این، درحالیکه در سایر روش‌های موجود، همانندی هر دو جمله از متون موردنظر به صورت مستقل بررسی می‌شود، در روش‌های پیشنهادی همانندی جملات همسایه نیز در بررسی همانندی دو جمله در نظر گرفته شده است. نتایج پیاده‌سازی و آزمایشات صورت گرفته بر روی روش‌های پیشنهادی نشان می‌دهد که در حالیکه هر دو روش از کیفیت مناسب و تقریبا یکسانی برخوردار هستند، روش همانندجوی احتمالاتی پیشنهادی بسیار کاراتر بوده و زمان موردنیاز برای همانندجویی با استفاده از آن به طور متوسط برابر با 3.8% زمان موردنیاز توسط الگوریتم همانندجوی معنایی پیشنهادی است
متن کامل [PDF 1181 kb]   (66 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: زبان شناسی رایانه ای
دریافت: ۱۳۹۶/۱۲/۱۳ | پذیرش: ۱۳۹۷/۶/۲۴

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA code

ارسال پیام به نویسنده مسئول


تمام حقوق این وب سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2018 All Rights Reserved | Iranian Journal of Information processing and Management

Designed & Developed by : Yektaweb