دوره 34، شماره 2 - ( زمستان 1397 )                   جلد 34 شماره 2 صفحات 897-922 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Alayiaboozar E. A Corpus-based study of Persian noun and adjective homographs to help right POS tagging. .... 2019; 34 (2) :897-922
URL: http://jipm.irandoc.ac.ir/article-1-3740-fa.html
علایی ابوذر الهام. بررسی پیکره-بنیاد هم‌نگاره‌های اسمی و صفتی فارسی جهت کمک به برچسب‌گذاری صحیح اجزای کلام. پژوهشنامه پردازش و مديريت اطلاعات. 1397; 34 (2) :897-922

URL: http://jipm.irandoc.ac.ir/article-1-3740-fa.html


پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)
چکیده:   (1700 مشاهده)
در تهیه سامانههای برچسبگذاری اجزای کلام در زبان فارسی، بررسی ساختواژی اسمها و صفتها از دو نظر حائز اهمیت است: 1. اگر در یک پیکره متنی فارسی کلمهای در واژگان حضور نداشته باشد (کلمه خارج از واژگان)، نمیتوان برچسبهای مربوط به کلمه را بازیابی کرد. در این صورت، برچسب کلمه را تنها میتوان با توجه به شکل کلمه (انواع پیشوندها و پسوندهایی که به کلمات متصل میشوند) یا بافتی که کلمه در آن ظاهر میشود، یا هر دو، حدس زد. 2. زبان فارسی ظرفیت بالایی برای ساخت همنگارههای جدید که از ساختواژه فارسی نشأت میگیرند، نیز دارد. بنابراین، بررسی ساختواژی اسمها و صفتها، بهمنظور تفکیک آنها از هم ضروری به نظر میرسد، زیرا اکثر صفتها در بافتهای گوناگون، با صورت نوشتاری یکسان میتوانند برچسب «اسم» بگیرند. در تحقیق حاضر ساختواژه اسمها و صفتها در فارسی بررسی شده است. نظام نوشتاری زبان فارسی نیز مورد بررسی قرار گرفته تا از این رهگذر بتوان به شناسایی انواع همنگارهها در زبان فارسی پرداخت. سپس، انواع همنگارهها در زبان فارسی مورد مطالعه قرار گرفته و در نهایت، از طریق جستوجو به دو روش ماشینی و دستی، فهرست مبسوطی از همنگارهها از پیکرههای «پیکره متنی زبان فارسی»، «پایگاه دادگان زبان فارسی» و «پیکره وابستگی نحوی زبان فارسی» تهیه شده است. بررسی کلی همنگارهها در پیکرههای مورد مطالعه نشان میدهد که بیشتر همنگارهها، فراوانی بالایی در پیکرههای متنی فارسی دارند و اکثر آنها در اثر یکسان بودن نمود نوشتاری تکواژ یای نکره، یای اسمساز، شناسه دوم شخص مفرد، یای صفتساز و یای متصل به گروه اسمی ایجاد شدهاند.
متن کامل [PDF 738 kb]   (610 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: فناوري اطلاعات
دریافت: ۱۳۹۶/۷/۲۲ | پذیرش: ۱۳۹۶/۱۲/۶ | انتشار: ۱۳۹۶/۱۲/۲۰

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


تمام حقوق این وب سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2019 All Rights Reserved | Iranian Journal of Information processing and Management

Designed & Developed by : Yektaweb