دوره 32، شماره 4 - ( تابستان 1396 )                   جلد 32 شماره 4 صفحات 1143-1170 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Hosseini Beheshti M S, Abdi Ghavidel H. Categorization of Various Essential Datasets and Methods for Textual Spelling Detection and Normalization. .... 2017; 32 (4) :1143-1170
URL: http://jipm.irandoc.ac.ir/article-1-3088-fa.html
حسینی‌بهشتی ملوک‌السادات، عبدی قویدل هادی. طبقه‌بندی انواع دادگان مورد نیاز و روش‌های خطایابی و استانداردسازی متنی. پژوهشنامه پردازش و مديريت اطلاعات. 1396; 32 (4) :1143-1170

URL: http://jipm.irandoc.ac.ir/article-1-3088-fa.html


پژوهشگاه علوم وفناوری اطلاعات ایران(ایرانداک)
چکیده:   (3131 مشاهده)

یکی از پایهایترین مراحل پردازش خودکار متن، تشخیص خطاهای املایی و استانداردسازی نویسههاست. بدون گذر از این مرحله، ذخیرهسازی مستندات متنی با مشکلات متعددی مواجه شده و موجب اختلال در بازیابی ماشینی آنها میگردد. بدینترتیب، متخصصان حوزههای پردازش زبان طبیعی و زبانشناسی رایانشی همواره در تلاش ظهستند تا با ارائه روشها و الگوریتمهای مطلوب انواع دادهها را در بوته پردازش قرار داده و به دادهای استاندارد دست یابند. در زبان انگلیسی و برخی زبانهای دیگر، تحقیقات متعددی در این زمینه انجام شده و بهدنبال آن زبان فارسی نیز در این زمینه مورد تحقیق قرار گرفته است. این تحقیقات متعدد گاهی در حد پژوهش به قوت خود باقی مانده و گاهی نیز در قالب محصول عرضه شده است. مقاله حاضر به طبقهبندی انواع روشها و دادگان مورد نیاز در این تحقیقات پرداخته و فرایند هر کدام از آنها را بهطور خاص و نحوه سنجش میزان دقت پردازش آنها را بهطور عام شرح میدهد. در این مقاله همچنین، نحوه عملکرد سامانههای تکزبانه فارسی توصیف شده و به نحوه برخورد آنها با چالشهای زبان فارسی اشاره میگردد.

متن کامل [PDF 812 kb]   (1138 دریافت)    
نوع مطالعه: مروري | موضوع مقاله: فناوري اطلاعات
دریافت: ۱۳۹۴/۱۱/۶ | پذیرش: ۱۳۹۵/۵/۱۲ | انتشار: ۱۳۹۵/۵/۳۱

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA code

ارسال پیام به نویسنده مسئول


تمام حقوق این وب سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2018 All Rights Reserved | Iranian Journal of Information processing and Management

Designed & Developed by : Yektaweb