[صفحه اصلی ]   [Archive] [ English ]  
irandoc irandoc irandoc irandoc irandoc
:: دوره 32، شماره 4 - ( تابستان 1396 ) ::
جلد 32 شماره 4 صفحات 1143-1170 برگشت به فهرست نسخه ها
طبقه‌بندی انواع دادگان مورد نیاز و روش‌های خطایابی و استانداردسازی متنی
ملوک‌السادات حسینی‌بهشتی ، هادی عبدی قویدل
استادیار پژوهشگاه علوم وفناوری اطلاعات ایران(ایرانداک)
چکیده:   (1636 مشاهده)

یکی از پایهایترین مراحل پردازش خودکار متن، تشخیص خطاهای املایی و استانداردسازی نویسههاست. بدون گذر از این مرحله، ذخیرهسازی مستندات متنی با مشکلات متعددی مواجه شده و موجب اختلال در بازیابی ماشینی آنها میگردد. بدینترتیب، متخصصان حوزههای پردازش زبان طبیعی و زبانشناسی رایانشی همواره در تلاش ظهستند تا با ارائه روشها و الگوریتمهای مطلوب انواع دادهها را در بوته پردازش قرار داده و به دادهای استاندارد دست یابند. در زبان انگلیسی و برخی زبانهای دیگر، تحقیقات متعددی در این زمینه انجام شده و بهدنبال آن زبان فارسی نیز در این زمینه مورد تحقیق قرار گرفته است. این تحقیقات متعدد گاهی در حد پژوهش به قوت خود باقی مانده و گاهی نیز در قالب محصول عرضه شده است. مقاله حاضر به طبقهبندی انواع روشها و دادگان مورد نیاز در این تحقیقات پرداخته و فرایند هر کدام از آنها را بهطور خاص و نحوه سنجش میزان دقت پردازش آنها را بهطور عام شرح میدهد. در این مقاله همچنین، نحوه عملکرد سامانههای تکزبانه فارسی توصیف شده و به نحوه برخورد آنها با چالشهای زبان فارسی اشاره میگردد.

واژه‌های کلیدی: تشخیص خطاهای املایی، استانداردسازی نویسه‌ها، طبقه‌بندی روش‌ها، سامانه‌های تکزبانه فارسی، چالش‌های زبان فارسی
متن کامل [PDF 812 kb]   (645 دریافت)    
نوع مطالعه: مروري | موضوع مقاله: فناوري اطلاعات
دریافت: ۱۳۹۴/۱۱/۶ | پذیرش: ۱۳۹۵/۵/۱۲ | انتشار: ۱۳۹۵/۵/۳۱
ارسال پیام به نویسنده مسئول

ارسال نظر درباره این مقاله
نام کاربری یا پست الکترونیک شما:

کد امنیتی را در کادر بنویسید >



XML   English Abstract   Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Hosseini Beheshti M S, Abdi Ghavidel H. Categorization of Various Essential Datasets and Methods for Textual Spelling Detection and Normalization. Journal of Information Processing and Management. 2017; 32 (4) :1143-1170
URL: http://jipm.irandoc.ac.ir/article-1-3088-fa.html
حسینی‌بهشتی ملوک‌السادات، عبدی قویدل هادی. طبقه‌بندی انواع دادگان مورد نیاز و روش‌های خطایابی و استانداردسازی متنی. پژوهشنامه پردازش و مديريت اطلاعات. 1396; 32 (4) :1143-1170

URL: http://jipm.irandoc.ac.ir/article-1-3088-fa.html

دوره 32، شماره 4 - ( تابستان 1396 ) برگشت به فهرست نسخه ها
پژوهشنامه پردازش و مدیریت اطلاعات Journal of Information processing and Management
نقشه پايگاه | پرسش‌هاي متداول | اطلاع‌رساني به دوستان | آمار پايگاه | حقوق | مسئوليت محتوا | روزآوري: ۱۳۹۶/۹/۲۱
كليه حقوق براي فصل‌نامه پردازش و مديريت اطلاعات محفوظ است.
Persian site map - English site map - Created in 0.214 seconds with 850 queries by yektaweb 3525