بررسی میزان مطابقت بازیابی محتوا با تصویرها و چالش‌های آن در مقاله‌های پایگاه‌های اطلاعاتی علمی

نویسندگان

1 دانشگاه شهید باهنر کرمان

2 پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)؛

چکیده

هدف از این تحقیق بررسی میزان مطابقت بازیابی محتوا با تصویرها و چالش‌های آن در مقاله‌های پایگاه‌های اطلاعاتی علمی است. روش پیمایشی توصیفی بوده و جامعه آماری آن پایگاه‌های اطلاعاتی علمی «ساینس دایرکت»، «اسکوپوس»، «مدلاین» و «وب آو ساینس» است. ابتدا عنوان، چکیده، بیان مسئله و نتیجه‌گیری مقاله‌ها به‌صورت جداگانه وارد نرم‌افزار  Extreme Picture Finderشد. سپس، تصویرهای مرتبط با عنوان، چکیده، بیان مسئله و نتیجه‌گیری مقاله‌ها از نرم‌افزار مورد نظر استخراج گردید. تصویرهای استخراج‌شده وارد نرم‌افزار Visual Similarity Duplicate Image Finder گردید تا مطابقت تصویرهای استخراج‌شده از نرم‌افزار و تصویرهای مقاله‌ها انجام شود. نتایج نشان داد که بیشترین میزان مطابقت محتوا با تصویر در پایگاه «وب‌‌آو‌‌ساینس» و کمترین میزان مطابقت در پایگاه «ساینس ‌دایرکت» وجود داشت. همچنین به‌ترتیب، بیشترین شباهت بین عنوان‌‏ها، بیان مسئله، چکیده و نتیجه‌گیری با تصویرهای مقاله‌ها در پایگاه‌ها وجود داشت.
عدم رعایت استانداردهای مصورسازی در تصویرهای به‌کاررفته در مقاله‌‏های پایگاه‌های علمی چالشی جدی است. تصاویری که از استاندارهای مصورسازی (متن، رنگ، لبه، حاشیه و ...) به دور بودند، بازیابی نشدند و در صورت بازیابی از میزان شباهت نازلی برخوردار بودند. عدم جامعیت قابلیت‌های نرم‌افزارهای مورد استفاده، چالش بعدی بود. مسئله دیگر عدم رعایت یا پیروی از یک شیوه‌نامه استاندارد در چیدمان تصویرها در مقاله‌هاست. برخی تصویرها بدون توجه به متن در مقاله‌ها درج شده‌اند. این مورد در پایگاه «وب‌آو‌ساینس» کمتر، اما در سایر پایگاه‌‏های مورد بررسی بسیار مشاهده گردید.
با توجه به ابداع روش‌های جدید بازیابی تصویر و محتوا، نتیجه این بررسی نشان می‌دهد که عدم شباهت بین تصویرهای بازیابی‌شده با محتوا در مقالات پایگاه‌های معتبر علمی چشمگیر و گمراه‌کننده است.

کلیدواژه‌ها


عنوان مقاله [English]

Assessing Rate of Matching Content Retrieval Conformity with Images and its Challenges in Scientific Database Articles

نویسندگان [English]

  • Adel Soleimani Nezhad 1
  • Fariborz droudi 2
  • Zynab morteza pour 1
چکیده [English]

The purpose of this research is to match the content retrieval with images in the articles of scientific databases. The research method is a correlation-based procedure and the statistical population of the present study is the scientific databases such as Science Direct, Scopus, Medline and Web of Science. Six papers were extracted from each base along with a separate issue. First, the title, abstract, problem statement and conclusion of the articles were inserted into the software Etreme Picture Finder, separately. Then, the images related to title, abstract, problem statement and conclusions of the articles were extracted from the relevant software. The images extracted were inserted into the Visual Similarity Duplicate Image Finder software. The results show that the highest level of content matching was found with the images in the WebAsiensis database and the least amount of match in the database of the SinjServer. There were also the most similarities between the titles, the problem statement, the abstract and the conclusions with the images of the articles in the bases.
Failure to observe the standards of visualization in the images used in scientific articles was a serious challenge. Images that have been removed from image editors (text, color, edges, margins, etc.) have not been recovered, and if recovered, they have had a fairly similar resemblance. The lack of comprehensiveness of the superficial capabilities used was the next challenge. Another problem is the non-observance of or compliance with a standard style sheet in the layout of images in the articles. Some images have been brought to the articles regardless of the text. This item was found to be smaller in the Web site, but was seen in many other sites.

کلیدواژه‌ها [English]

  • Image Retrieval
  • Content Based Image Retrieval
  • Image Matching Content
  • Challenges of Matching Content with the Image
  • Scientific Databases