بازشناسی نوری حروف: مروری بر مباحث نظری و ملاحظات کاربردی با تأکید بر مسائل خاص زبان فارسی

نویسنده

چکیده

در این مقاله مبانی نظری و جنبه‌های کاربردی مبحث بازشناسی نوری حروف (اُسی‌آر) بصورت جامع مورد بررسی قرار می‌گیرند و زیربخش‌ها و بلوک‌های پردازشی آن معرفی می‌گردند. همچنین خصایص و پیچیدگی‌های مختص نگارش زبان فارسی که یک نرم‌افزار «اُسی‌آر» باید آن‌ها را در عملیات پردازشی خود لحاظ نماید، بیان خواهند شد. تحقیقات داخلی انجام‌شده در زمینه «اُسی‌آر» مورد اشاره قرار خواهند گرفت؛ نرم‌افزارهای معروف تجاری «اُسی‌آر» لاتین و فارسی معرفی، و قابلیت‌ها و نقاط قوت و ضعف آن‌ها تشریح می‌شوند. در آخر هم پیشنهادهایی در راستای انتخاب راهکارهای مناسب به منظور تسریع در حصول یک نرم‌افزار «اُسی‌آر» کارآمد برای زبان فارسی ارائه می‌گردد. مخاطب این مقاله، دانش‌آموختگان رشته‌های فنی و غیرفنی هستند که قصد دارند درباره این حوزه اطلاعات مقدماتی کسب نمایند. ازاین رو از جنبه‌های محاسباتی و ریاضیات مسئله چشم‌پوشی شده است.

کلیدواژه‌ها


عنوان مقاله [English]

Optical Character Recognition: A review of theoretical and practical considerations with special emphasis on particularities of Farsi language

نویسنده [English]

  • Esmael Faramarzi
چکیده [English]

The present paper provides a thorough treatment of the theoretical as well as practical underpinnings for optical character regonition (OCR). It describes the unique characteristics and complexities of Farsi script which an OCR software must be capable of processing. A review of the researches carried out in Iran to date is offered. Popular commercial OCR softwares are compared. Suggestions are offered towards choosing a suitable solution leading to a versatile OCR software for Farsi. In the interest of reaching a larger audience wishing to acquire basic knowledge about OCR, the paper does not deal with computational and mathematical aspects.

کلیدواژه‌ها [English]

  • optical character recognition (OCR)
  • document image analysis (DIA)
  • statistical pattern recognition