سنجش میزان ربط تصاویر بازیابی شده در موتورهای کاوش مبتنی بر ویژگی‌های نگارشی زبان فارسی

نویسندگان

1 دانشگاه قم

2 دانشگاه تهران، تهران، ایران

3 دانشگاه حضرت معصومه (س)، قم ، ایران

چکیده

این پژوهش با هدف بررسی تصاویر بازیابی شده از موتورهای کاوش برگزیده طبق ویژگی‌های نوشتاری و معنایی زبان فارسی و تعیین میزان ربط آن‌ها با استفاده از فرمول‌های جامعیت و دقت و نیز شناسایی کارآمدترین موتورکاوش در بازیابی تصاویر به زبان فارسی و به روش پیمایشی - تحلیلی و با استفاده از شیوه مشاهده مستقیم انجام گرفت. پس از مرور پژوهش‌های مرتبط، کلیدواژه‌های کاوش در قالب یک سیاهه بر اساس ویژگی‌های نوشتاری و معنایی زبان فارسی شکل گرفت. هر یک از این کلیدواژه‌ها در موتورهای کاوش مورد مطالعه شامل دو موتورکاوش معمولی گوگل و بینگ و موتور کاوش معنایی داک داک گو که در زمرهء موتورهای کاوش پراستفاده هستند و قابلیت جستجوی تصاویر به زبان فارسی را نیز فراهم نموده‌­اند، جستجو و تعداد نتایج بازیابی شده مرتبط و غیر مرتبط ثبت گردید. سپس جامعیت و دقت نتایج جستجو در هر موتور کاوش محاسبه و به بررسی میزان ربط تصاویر بر اساس این ویژگی‌ها در هر یک از موتورهای کاوش مورد مطالعه پرداخته شد. برای تجزیه و تحلیل داده‌ها از انواع فنون آماری توصیفی به همراه آزمون کلموگروف-اسمیرنوف، شاپیرو-ویلک، کروسکال-والیس و فریدمن استفاده شد. یافته‌های پژوهش نشان داد موتورهای کاوش مورد مطالعه نسبت به ویژگی‌های نوشتاری و معنایی زبان فارسی توجه کافی ندارند و بسیاری از این ویژگی‌ها را در هنگام جستجو و بازیابی تصاویر نادیده می‌گیرند. در پژوهش حاضر، موتور کاوش گوگل از جامعیت و دقت بالاتری نسبت به دو موتور کاوش دیگر برخوردار بود و علیرغم ادعای موتورهای کاوش معنایی مبنی بر فراهم‌آوری اطلاعات با کیفیت‌تر و مرتبط‌تر نسبت به دیگر موتورهای جستجو، موتور کاوش داک‌داک‌گو عملکرد مطلوبی در زمینه بازیابی تصاویرمرتبط با بخش نوشتاری و معنایی زبان فارسی از خود نشان نداد. همچنین بین میزان جامعیت و دقت سه موتور کاوش مورد پژوهش اختلاف معناداری وجود دارد.

کلیدواژه‌ها


عنوان مقاله [English]

Measuring the relevance of retrieved images in search engines based on Persian language writing styles

نویسندگان [English]

  • Yaghub Norouzi 1
  • Hoda Homavandi 2
  • Bent-ol hoda khabbazan 3
چکیده [English]

The aim of this study was to investigate the image retrieval from selected search engines according to the written and semantic features of Persian language and determine their relevance using recall and precision formulas and to identify the most efficient search engine in retrieving images in Persian and by survey-analytical method. It was done using direct observation technique. After reviewing related researches, search keywords list was formed in the form of a checklist based on the written and semantic features of Persian language. Each of these keywords in the studied search engines, including two general search engines Google and Bing and Duckduckgo semantic search engine, which are among the most used search engines and have also provided the ability to search for images in Persian, search and the number of relevant and unrelated retrieved results were recorded. Then, the recall and precision of search results in each search engine were calculated and the relevance of images based on these features in each of the studied search engines was investigated. A variety of descriptive statistical techniques were applied to analyze the data along with Kolmogorov-Smirnov, Shapiro-Wilk, Kruskal-Wallis and Friedman tests. Findings demonstrated that Google, Bing and Duckduckgo search engines do not pay enough attention to the written and semantic features of Persian language and many of these features are ignored while searching and retrieving images. In the present study, Google search engine had a higher recall and precision than the other two search engines, and despite the claim of semantic search engines to provide better and more relevant information than other search engines, Duckduckgo search engine did not show good performance in retrieving images related to the written and semantic part of Persian language. There is also a significant difference between the recall and the precision of the three studied search engines.

کلیدواژه‌ها [English]

  • Image Retrieval
  • Relevance
  • Recall
  • Presidion
  • Search Engines
  • Persian language
 
(دسترسی در 15/2/1400)http://publij.ir/article-۱-۴۸۸-fa.html
ابوالقاسم مسلمان، طاهره، عصمت مؤمنی، و محسن حاجی زین‌العابدینی. 1394. سنجش میزان ربط تصاویر بازیابی‌شده در موتورهای جست‌وجوی یاهو، گوگل، پیک‌سرچ و فلیکر و ارائه الگوی پیشنهادی بهینه. دانش‌شناسی 8 (28): 1- 12.
احمدی، فاطمه، و مظفر چشمه‌سهرابی. 1391. مقایسه میزان جامعیت و مانعیت در ابزارهای کاوش اطلاعات فازی و غیرفازی. نظام‌ها و خدمات اطلاعاتی 1 (3): 75 – 88.
آخرین آمار از ضریب نفوذ اینترنت در ایران. خبرگزاری مهر، 14 مرداد 1399.
‌بهمن‌آبادی،‌ علیرضا. 1381. مبانی تاریخچه و فلسفه علم اطلاع‌رسانی (گزیده مقالات). تهران: سازمان اسناد و کتابخانه ملی جمهوری اسلامی ایران.
پائو، میراندا لی. 1989. مفاهیم بازیابی اطلاعات. ترجمه اسدالله آزاد و رحمت‌الله فتاحی. 1387. مشهد: انتشارات دانشگاه فردوسی.
جلالی دیزجی، علی، رضا خالقی، و مهدی طاهری. 1395. میزان جامعیت و مانعیت بازیابی تصاویر در موتورهای کاوش  Bingو .Google Image نظام‌ها و خدمات اطلاعاتی 5 (34): 33-42.
حری، عباس. 1372. کامپیوتر و رسم‌الخط فارسی. تحقیقات اطلاع‌رسانی و کتابخانه‌های عمومی. ۳ (۱): 6-11.
حریری، نجلا، و حسین وکیلی‌مفرد. 1392. مقایسه دقت موتوهای کاوش عمومی و تخصصی پزشکی در بازیابی تصاویر پزشکی. مدیریت اطلاعات سلامت 10 (6): 830 – 839.
خادمی‌زاده، شهناز، فریده عصاره، و خدیجه مبینی. 1397. بررسی مقایسه‌ای تأثیر نمایه‌سازی متن‌محور و فولکسونومی تصاویر بر میزان بازیابی تصاویر در موتور کاوش گوگل. تعامل انسان و اطلاعات 5 (3): 15-27.
دری، راحله. 1393. مقایسه و ارزیابی موتورهای جست‌وجوی معنایی. پژوهشنامه پردازش و مدیریت اطلاعات 30 (2): 467-487.
رجبی، سید منصور و یعقوب نوروزی. 1394. موتورهای جست‌وجوی فارسی: ارزیابی امکانات جست‌وجو، بازیابی اطلاعات، میزان جامعیت و مانعیت، و تعیین همپوشانی میان آن‌ها. فصلنامه مطالعات ملی کتابداری و سازماندهی اطلاعات 26 (3): 133–150.
عباسی دشتکی، ندا، و مظفر چشمه‌سهرابی. 1398. عملکرد موتورهای جست‌وجوی گوگل، یاهو و بینگ در بازیابی اطلاعات فارسی. مطالعات ملی کتابداری و سازماندهی اطلاعات 30 (2): 96-111.
کوکبی، مرتضی، صالح رحیمی، فریده عصاره، و علیرضا نوروزی. ۱۳۹۲. تأملاتی بر نمایه‌‌سازی تصاویر: یک تصویر ارزشی برابر با هزار واژه .تحقیقات اطلاع‌رسانی و کتابخانه‌های عمومی ۱۹ (۲): ۲۵۷-۲۷۶.
نوتس، گری. 1997. راهبرد‌ها و شیوه‌های جست‌وجو در اینترنت. ترجمه سیمین نیازی. 1382. فصلنامه مطالعات ملی کتابداری و سازماندهی اطلاعات 14 (3): 126– 133.
نوروزی، یعقوب، سمانه خویدکی و زهرا صدرآبادی. 1400. پژوهش‌های حیطه ربط در ایران: مرور نظام‌مند. پژوهشنامه پردازش و مدیریت اطلاعات ۳۶ (3): ۶۲۱-۶۵۴.
نوروزی، یعقوب، و فرشته سوری. 1393. ارزیابی موتورهای جست‌وجو در بازیابی تصاویر برپایة نمایه‌سازی مبتنی ‌بر متن و محتوا. کتابداری و اطلاع‌رسانی 17 (1): 183 – 205.
هماوندی، هدی. 1392. بررسی مشکلات جست‌وجو و بازیابی تصاویر در موتورهای کاوش برگزیده مبتنی ‌بر ویژگی‌های نگارشی زبان فارسی. پایان‌نامه کارشناسی ارشد. دانشگاه قم.
یقطین، مریم، و عبدالرسول جوکار. 1396. کارآمدی فیلد زبان در موتورهای کاوش بین‌المللی برای بازیابی نتایج مرتبط با زبان فارسی و عربی (مطالعه مقایسه‌ای: گوگل، بینگ، و یاهو). مطالعات ملی کتابداری و سازماندهی اطلاعات 28 (2): 141 – 175.
 
Bute, M. S., A. Hussaini, & I. H. Adamu. 2017. Evaluating search effectiveness of some selected search engines. Global Journal of Pure and Applied Sciences 23 (1): 139-149.
CheshmehSohrabi, M. (Mozaffar), and E. Adnani Sadati. 2021. Performance evaluation of web search engines in image retrieval: An experimental study. Information Development 138 (4): 522-534. Retrieved from https://doi.org/10.1177/0266666 9211010211 (May 25, 2021)
Clarke, S., and P. Willett .1997. Estimatiing the recall performance of search service performance. Aslib Proceedings 49 (7): 184 -189.
Clarkson, Kari. 2014. 12 fun state that proof power of images. Proceeding of the SIGCHI conference of computer and security. Toronto, Canada, 2: 456-459.
Gross, A. M. 2014. Search engine behavior and satisfaction of Arab students from a user perspective. International Journal of Computational Linguistics Research 5 (3): 85-98.
Hammo, Bassam H. 2009. Towards enhancing retrieval effectiveness of search engines for diacritisized Arabic documents. Information Retrieval 12 (3): 300-323.
Hussan, Bzar. 2020. Comparative Study of Semantic and Keyword Based Search Engines. Advances in Science, Technology and Engineering Systems Journal 5: 106-111.
Internet World Stats. (31 March 2020) Number of Internet Users by Language. Miniwatts Marketing Group, Retrieved from https://www.internetworldstats.com/stats7.htm (accessed Nov. 10, 2020)
Kumar, B. S., & J. N. Prakash. 2009. Precision and relative recall of search engines: A comparative study of Google and Yahoo. Singapore Journal of Library & Information Management 38 (1): 124-137.
Lancaster, Fredrick Wilfrid. 1979. Information Retrieval Systems Characteristics, testing, and evaluation. NewYork: Wiley.
Lopez, CT, and C. Ribeiro. 2011. Comparative evaluation of web search engines in health information retrieval. Online information review 35 (6): 869-892.
Menard, E. 2007. Image Indexing: How Can I Find a Nice Pair of Italian Shoes? Bullettn of American Society for Information Science and Technology 34 (1): 2-21.
Negi, Y. S., and S. Kumar. 2014. A comparative analysis of keyword- and semantic-based search engines. Intelligent computing, Networking, and informatics 243: 727-736.
Norouzi, Yaghoub, and Hoda Homavandi. 2018. Image search and retrieval problems in web search engines: A case study of Persian language writing style challenge. Online Information Review 42 (6): 752-767.
Prasher, Ram Gopal. 1989. Index and indexing systems. Delhi: Medallion press.
Saracevic. T. 2007. Relevance: A Review of the Literature and a Framework for Thinking on the Notion in Information Science. Part III: Behavior and Effects on Relevance. Journal of the American Society for Information Science and Technology 58 (13): 2126—2144