دوره 21، شماره 3 - ( پاییز 1385 )                   جلد 21 شماره 3 صفحات 1-34 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Faramarzi E. Automatic Recognition of Table of Content Given their Stylistics in Farsi and Western Dissertation. .... 2006; 21 (3) :1-34
URL: http://jipm.irandoc.ac.ir/article-1-93-fa.html
فرامرزی اسماعیل. تشخیص خودکار صفحات فهرست با توجه به الگوی آنها در پایان‌نامه‌های فارسی و لاتین. پژوهشنامه پردازش و مديريت اطلاعات. 1385; 21 (3) :1-34

URL: http://jipm.irandoc.ac.ir/article-1-93-fa.html


چکیده:   (11565 مشاهده)

صفحات فهرست در هر نوع مدرک (کتاب، مجله، پایان‌نامه، ...)، به نحو مختصر و فشرد‌ه، ساختار منطقی آن مدرک را بیان می‌کنند و به کمک آن‌‌ها می‌توان به راحتی ساختار مدرک را مشاهده نمود و مستقیماً به مطالب مورد نظر دست یافت. در این مقاله برای اولین بار روشی به منظور شناسایی خودکار صفحات فهرست در پایان‌نامه‌‌های فارسی، عربی و لاتین ارائه می‌شود. در این روش، شناسایی صفحات فهرست با توجه به الگوی آن‌‌ها بدون استفاده از عملیات بازشناسی متن (اُسی‌آر) و تنها با به‌کارگیری فنون پردازش تصویر، مد نظر بوده. با این روش می‌توان صفحات فهرست را صرف نظر از نوع زبان و ترازبندی (راست به چپ یا چپ به راست بودن) متن آن‌‌ها، شناسایی کرد و به دلیل عدم استفاده از اُسی‌آر، تابع کیفیت متن مدرک اسکن‌شده نیست. روش مذکور بر روی دسته‌ای از پایان‌نامه‌‌های فارسی، عربی و لاتین موجود در پایگاه اطلاعاتی پژوهشگاه اطلاعات و مدارک علمی ایران مورد آزمایش قرار گرفت و دقت 7/99 درصد در بازشناسی صحیح حاصل گردید.

متن کامل [PDF 1240 kb]   (2660 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: فناوري اطلاعات
دریافت: ۱۳۸۸/۵/۶

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA code

تمام حقوق این وب سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2018 All Rights Reserved | Iranian Journal of Information processing and Management

Designed & Developed by : Yektaweb