Comparison of Sakhr and Google Optical Characters for Persian Language

Authors

Abstract

Concerning the importance & necessity of using OCR programs in library and information centers, this research aims at evaluating the new Persian OCR programs (Sakhr and Google). Analytical exploratory research method is used and data are gathered in a practical way through purposive observing the cases. Checklist is used as the gathering tools. Results of the study show some good and bad specifications in both programs. The outcome part of the Google program is acceptable with fewer errors but in other outcome module characteristics such as word recognition, Sakhr program did better. Due to the availability of “Google” software only through the Internet and the possibility of uploading only 20 pages at a time, there are usage restrictions for the user.

Keywords


  1. آگاهی، حامد، و مرضیه صالحی. 1395. مروری بر سیستم‌های بازشناسی ارقام دست‌نویس فارسی. اولین کنفرانس بین‌المللی دستاوردهای نوین پژوهشی در مهندسی برق و کامپیوتر. تهران.
  2. آگاهی، حامد، و مرضیه صالحی. 1395. مروری بر سیستم‌های بازشناسی ارقام دست‌نویس فارسی. اولین کنفرانس بین‌المللی دستاوردهای نوین پژوهشی در مهندسی برق و کامپیوتر. تهران.
  3. ایرانپور مبارکه، مجید، و علیرضا احمدی‌فرد. 1395. ارائه خصیصه‌های خاص زبان فارسی جهت بازیابی و بازشناسی کلمات تصویری فارسی با استفاده از تعبیۀ برچسب. مجله ماشین بینایی و پردازش تصویر 3 (1): 45-54.
  4. ایرانپور مبارکه، مجید، و علیرضا احمدی‌فرد. 1395. ارائه خصیصه‌های خاص زبان فارسی جهت بازیابی و بازشناسی کلمات تصویری فارسی با استفاده از تعبیۀ برچسب. مجله ماشین بینایی و پردازش تصویر 3 (1): 45-54.
  5. حریری، نجلا. 1385. اصول و روش‌های پژوهش کیفی. تهران: دانشگاه آزاد اسلامی، واحد علوم و تحقیقات.
  6. حریری، نجلا. 1385. اصول و روش‌های پژوهش کیفی. تهران: دانشگاه آزاد اسلامی، واحد علوم و تحقیقات.
  7. خسروی، حسین، و احسان‌اله کبیر. 1388. ارزیابی روش‌های بازشناسی متون فارسی بر مبنای شکل کلی زیرکلمات. نشریه مهندسی برق و مهندسی کامپیوتر ایران 7 (4): 267-280.
  8. خسروی، حسین، و احسان‌اله کبیر. 1388. ارزیابی روش‌های بازشناسی متون فارسی بر مبنای شکل کلی زیرکلمات. نشریه مهندسی برق و مهندسی کامپیوتر ایران 7 (4): 267-280.
  9. دبیرخانۀ شورای عالی اطلاع‌رسانی. 1388. پژوهشنامه نویسه‌خوان نوری فارسی (OCR). تهران: دبیرخانۀ شورای عالی اطلاع‌رسانی.
  10. دبیرخانۀ شورای عالی اطلاع‌رسانی. 1388. پژوهشنامه نویسه‌خوان نوری فارسی (OCR). تهران: دبیرخانۀ شورای عالی اطلاع‌رسانی.
  11. زند، محسن. 1391. تشخیص حروف چاپی فارسی با استفاده از روش ترکیبی. همایش منطقه‌ای علوم کامپیوتر، مهندسی کامپیوتر و فناوری اطلاعات. دورود.
  12. زند، محسن. 1391. تشخیص حروف چاپی فارسی با استفاده از روش ترکیبی. همایش منطقه‌ای علوم کامپیوتر، مهندسی کامپیوتر و فناوری اطلاعات. دورود.
  13. سلیمانی، سید محمد، و هادی حسینی. 1394. یک رویکرد مبتنی بر مدل برای شناسایی و اصلاح نویسه‌های فارسی و عربی مستقل از متن آفلاین. دومین کنگره سراسری فناوری‌های نوین ایران با هدف دستیابی به توسعه پایدار. تهران.
  14. سلیمانی، سید محمد، و هادی حسینی. 1394. یک رویکرد مبتنی بر مدل برای شناسایی و اصلاح نویسه‌های فارسی و عربی مستقل از متن آفلاین. دومین کنگره سراسری فناوری‌های نوین ایران با هدف دستیابی به توسعه پایدار. تهران.
  15. فرامرزی، اسماعیل. 1384. بازشناسی نوری حروف: مروری بر مباحث نظری و ملاحظات کاربردی با تأکید بر مسائل خاص زبان فارسی. پژوهشنامه پردازش و مدیریت اطلاعات 20 (3-4): 33-61.
  16. فرامرزی، اسماعیل. 1384. بازشناسی نوری حروف: مروری بر مباحث نظری و ملاحظات کاربردی با تأکید بر مسائل خاص زبان فارسی. پژوهشنامه پردازش و مدیریت اطلاعات 20 (3-4): 33-61.
  17. هنروران، فرامرز. 1375. اُسی‌آر و کاربردهای آن در کتابخانه‌ها و مراکز اطلاع‌رسانی. تحقیقات اطلاع‌رسانی و کتابخانه‌های عمومی 20 (6): 50-53.
  18. هنروران، فرامرز. 1375. اُسی‌آر و کاربردهای آن در کتابخانه‌ها و مراکز اطلاع‌رسانی. تحقیقات اطلاع‌رسانی و کتابخانه‌های عمومی 20 (6): 50-53.
  19. Dhiman, Shivani, and A Singh. 2013. Tesseract vs gocr a comparative study. International Journal of Recent Technology and Engineering 2 (4): 80.
  20. Dhiman, Shivani, and A Singh. 2013. Tesseract vs gocr a comparative study. International Journal of Recent Technology and Engineering 2 (4): 80.
  21. Kanungo, Tapas, Gregory A. Marton, and Osama Bulbul. 1998. Performance evaluation of two Arabic OCR products. Proceedings of SPIE. Paper presented at the International Society for Optical Engineering. [DOI:10.1117/12.339809]
  22. Kanungo, Tapas, Gregory A. Marton, and Osama Bulbul. 1998. Performance evaluation of two Arabic OCR products. Proceedings of SPIE. Paper presented at the International Society for Optical Engineering. [DOI:10.1117/12.339809]
  23. _____. 1999. OmniPage vs. Sakhr: Paired model evaluation of two Arabic OCR products. Proceedings of SPIE. Paper presented at the International Society for Optical Engineering.
  24. _____. 1999. OmniPage vs. Sakhr: Paired model evaluation of two Arabic OCR products. Proceedings of SPIE. Paper presented at the International Society for Optical Engineering.
  25. Sajedi, Hedieh. 2016. Handwriting recognition of digits, signs, and numerical strings in Persian. Computers & Electrical Engineering. 49: 52-65. [DOI:10.1016/j.compeleceng.2015.11.030]
  26. Sajedi, Hedieh. 2016. Handwriting recognition of digits, signs, and numerical strings in Persian. Computers & Electrical Engineering. 49: 52-65. [DOI:10.1016/j.compeleceng.2015.11.030]
  27. Shayegan, Mohammad Amin, and Chee Seng Chan. 2012. A new approach to feature selection in handwritten farsi/ arabic character recognition. Advanced Computer Science Applications and Technologies (ACSAT). International Conference on Advanced Computer Science Applications and Technologies. Kuala Lumpur, Malaysia. [DOI:10.1109/ACSAT.2012.77]
  28. Shayegan, Mohammad Amin, and Chee Seng Chan. 2012. A new approach to feature selection in handwritten farsi/ arabic character recognition. Advanced Computer Science Applications and Technologies (ACSAT). International Conference on Advanced Computer Science Applications and Technologies. Kuala Lumpur, Malaysia. [DOI:10.1109/ACSAT.2012.77]