دوره 37، شماره 3 - ( بهار 1401 )                   جلد 37 شماره 3 صفحات 918-895 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

fakhrzadeh A, Rahnama M, Nasiri J A. Automatic Annotation of Images in Persian Scientific Documents Based on Text Analysis Methods. .... 2022; 37 (3) :895-918
URL: http://jipm.irandoc.ac.ir/article-1-4681-fa.html
فخرزاده آزاده، رهنما محدثه، نصیری جلال‌الدین. ارائه روشی برای برچسب زدن تصاویر موجود در متون علمی فارسی با استفاده از روش‌های پردازش متن. پژوهشنامه پردازش و مديريت اطلاعات. 1401; 37 (3) :918-895

URL: http://jipm.irandoc.ac.ir/article-1-4681-fa.html


پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)، تهران؛ ایران
چکیده:   (858 مشاهده)
در این مقاله یک روش جدید برای برچسب‌گذاری تصاویر موجود در متون علمی فارسی معرفی می‌شود. در اسناد و مقالات علمی، تصاویر حاوی اطلاعلات مهمی هستند و در بسیاری از موارد به‌تنهایی با بررسی آن‌ها می‌توان به ایده اصلی و یا نتایج مهم مقاله علمی پی برد، بدون اینکه لازم باشد کل مقاله را مطالعه کرد. به‌خاطر رشد روزافزون داده‌های تصویری، بازیابی تصاویر از اسناد علمی توجه زیادی را به خود جلب کرده و به یک موضوع روبه‌رشد در ادبیات تبدیل شده است. اولین قدم در بازیابی تصاویر تخصیص برچسب‌های توصیف‌کننده به هر تصویر است. 
در اینجا برای استخراج برچسب تصویر از متن سندی که تصویر به آن تعلق دارد، استفاده شده است. زیرنویس و قسمتی از متن سند که در آن به تصویر مورد نظر اشاره شده است، در نظر گرفته می‌شود. عبارات اسمی در متنِ همراه تصویر با استفاده از پنج روش متفاوتِ فراوانی عبارات در سند، معکوس فراوانی سند، فراوانی کلمه-معکوس فراوانی سند، شباهت کسینوسی عبارات با زیرنویس، و ترکیب روش فراوانی کلمه-معکوس فراوانی سند و شباهت کسینوسی با زیرنویس رتبه‌بندی می‌شوند. در هر روش، برچسب‌های انتخابی برای تصویر، عبارات اسمی با رتبه بالاتر در آن روش است. روش‌های معرفی‌شده با استفاده از داده آزمایشی از پایگاه اطلاعات علمی ایران (گنج) که منبع اصلی اسناد علمی فارسی است، ارزیابی می‌شوند. طبق نتایج به‌دست‌آمده در این تحقیق روش فراوانی کلمه-معکوس فراوانی سند بهترین روش برای برچسب زدن تصاویرموجود در اسناد علمی است.
متن کامل [PDF 1735 kb]   (329 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: تحلیل داده‌های کلان
دریافت: 1400/1/8 | پذیرش: 1400/2/26 | انتشار: 1401/1/10

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

تمام حقوق این وب سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2022 CC BY-NC 4.0 | Iranian Journal of Information processing and Management

Designed & Developed by : Yektaweb