بررسی واکنش موتورهای کاوش وب به پیشینه‌های فرادا‌ده‌ای مبتنی برروش ترکیبی داده‌های خرد و روش داده‌های پیوندی

نویسندگان

دانشگاه علامه طباطبائی

چکیده

پژوهش حاضر، با هدف تبیین واکنش موتورهای کاوش وب به پیشینه‌های فراداده‌ای مبتنی بر روش ترکیبی داده‌های خرد و روش داده‌های پیوندی با رویکرد تجربی انجام شد. جامعه پژوهش را 200 پیشینه فراداده‌ای در قالب دو گروه گواه و آزمون با تعداد پیشینه‌ی برابر تشکیل می‌دادند. پیشینه‌های یاد شده به روش نمونه‌گیری تصادفی، از میان پیشینه‌های فراداده‌ای دروازه اطلاعاتی کنسرسیوم محتوای ملی انتخاب شدند‌. در گروه آزمون، 100 پیشینه فراداده‌ای انتخاب شده با رویکرد ترکیبی بر مبنای دو روش داده‌های خرد، به عنوان بهترین روش تولید خرده‌های غنی، و داده‌‌های ‌پیوندی (قالب آردی‌اف/ ایکس‌ام‌ال) ایجاد، و در گروه گواه، 100 پیشینه بدون تغییر و با قالب اولیه آماده، و بر روی وب سایت http://ww.rnikzad.ir  منتشر شدند. سپس وب سایت بیان شده به صورت مستقیم و بر اساس روش‌های توصیه شده، به موتورهای کاوش گوگل و بینگ معرفی شد. با استفاده از سیاهه وارسی، وضعیت نمایه‌پذیری و پیدانمایی پیشینه‌های فراداده‌ای هر دو گروه در محیط موتورهای کاوش انتخابی مورد بررسی قرار گرفت. یافته‌های پژوهش حاکی از آن است، موتورهای کاوش گوگل و بینگ ارزش‌های عناصر پیشینه‌های فراداده‌های گروه‌های گواه و آزمون را نمایه‌سازی کردند، و پیشینه‌های مرتبط را با جستجوی ارزش‌های عناصر فراداده‌ای در نتایج جستجو پدیدار می‌نمایند، اما نمایش آنها به شکل معنادار و همانند پیشینه‌های فراداده‌ای تولید شده فقط مبتنی بر روش‌های تولید خرده‌های غنی نبود. به عبارت دیگر، نرم‌افزارهای خزنده-نمایه‌ساز موتورهای کاوش وب توانایی شناسایی و تشخیص برچسب‌های (عناصر) توصیه شده براساس روش داده‌های خرد را که در قالب چارچوب توصیف منبع (آر‌دی‌اف)، به عنوان چهارچوب و بستر نحوی روش داده‌های پیوندی، پیاده‌سازی شده‌اند، ندارند، و به پیروی از آن، این پیشینه‌ها را در نتایج جستجو به صورت معنادار نمایش نمی‌دهند. بنابراین موتورهای کاوش وب با وجود تلاش برای ایجاد وب معنایی، سازگاری کامل با استانداردهای وب معنایی ندارند.

کلیدواژه‌ها


عنوان مقاله [English]

Study on Search Engines’ Reaction to the Metadata Records Created Based on Combined Method of Rich snippets and Linked Data

نویسندگان [English]

  • Seyyed Mahdi Taheri
  • Reza Nikzad Bahle
  • Mitra Samiee
چکیده [English]

The purpose of this research was to find out the reaction of Web Search Engines to Metadata records created based on the combined method of Rich Snippets and Linked Data. 200 metadata records in two groups (100 records as the control group with the normal structure and, 100 records created based on microdata and implemented in RDF/XML as experimental group) extracted from the information gateway of Iranian Content National Consortium (INCN) were analyzed through an experimental approach. The metadata records of two groups were published on an independent website (www.rnikzad.ir), and were introduced to Google and Bing search engines directly. The using a checklist, the status of index ability and visibility of the published metadata records in two search engines were examined. Findings show all the element values of the metadata records of two groups indexed by Google and Bing, and were visible in the search results; but the records were not displayed in the search results semantically like the metadata records created in rich snippets methods only. In the other words, the spider-indexer software of Web search engines are not able to identify and index the metadata elements (tags) created based on microdata method and implemented in RDF (as the syntax of linked data method) and, the search engines cannot display the records in the search results semantically. So Web search engine are not adaptable to the standards of the semantic web.

کلیدواژه‌ها [English]

  • Indexing
  • visibility
  • Metadata Records
  • Rich snippets
  • linked data
  • Web search engines
Berners-Lee, Tim. 2006. Linked Data. Retrieved from http://www.w3.org/DesignIssues/LinkedData.html. (accessed Feb. 5, 2016). Henshaw, Robin, and Edward J Valauskas. 2001. Metadata as a Catalyst: Experiments with Metadata and Search Engines in the Internet Journal. First Monday. www.librijournal.org/pdf/1999-3pp125-131.pdf (accessed July 14, 2016). Isaksen, Leif. 2011. Archaeology and the Semantic Web. http://eprints.soton.ac.uk/196571/1.hasCoversheetVersion/y_gao_PhD_thesis_0111.pdf (accessed July 14, 2016). Mixter, Jeffrey. 2013. Linked Data in VRA Core 4.0: Converting VRA XML Records into RDF/XML. http://jmixter.s3-website-us-east-1.amazonaws.com/thesis/LinkedDataInVRACore4.pdf (accessed July 14, 2016). Mohamed, Khaled A. F. 2006. The impact of metadata in web resources discovering. Online Information Review 30 (2): 155-167. Quevedo-Torrero, and Jesus Ubaldo .2004. Improving web retrieval by mining the html tags for keywords and exploring the hyperlink structures web pages. Ph. D. Dissertation. Department of Computer Science, University of Houston. ‎http://wwwlib.umi.com/dissertations/fullcit/3156028‎. (accessed July 14, 2016). Safari, Mehdi. 2005. Search Engine and Resource Discovery on the Web: Is Dublin Core an Impact Factor. www.webology.ir/2005/v2n2/a13.html. (accessed July 14, 2016). Sokvine, Lloyd. 2000. An Evaluation of the Effectiveness of Current Dublin Core Metadata for Retrieval. www.vala.org.au/vala2000/2000pdf/Sokvitne.PDF (accessed July 14, 2016). Taheri, S. M., Nadjla Hariri, and S. R. Fattahi. 2014a. Does discarding XML Declarations and Changing File Extensions improve the Indexability and Visibility of Metadata Tag Names in Web Search Engines? Journal of Information Science 40 (6): 796-805. _____. 2014b. Using Data Island Method for Creating Metadata Records with Indexability and Visibility of Element Tag Names in the Web Search Engines. Library High Tech. 32 (1): 83-97. Turner, Thomas P, and Lise Brackbill. 1998. Rising to the Top: Evaluating the Use of the HTML META Tag to Improve Retrieval of World Wide Web Documents through Internet Search Engines. http://cat.inist.fr/?aModele=afficheN&cpsidt=1748620 (accessed July 14, 2016). Van der Meer, J., F. Boon, F. Hogenboom, F. Frasincar, and U. Kaymak. 2011. A framework for automatic annotation of web pages using the Google rich snippets vocabulary. In Proceedings of the 2011 ACM Symposium on Applied Computing, TaiChung, Taiwan, pages: 765-772. ACM. Zhang, Jin, and Alexandra Dimitroff. 2004. Internet search engine’s response to metadata Dublin Core implementation. http://portal.acm.org/citation.cfm?id=1142111 (accessed July 14, 2016). _____. 2005a. The impact of metadata implementation on Webpage visibility in search engine result (Part II). http://www.sciencedirect.com/science?_ob=ArticleURL&_udi=B6VC8-4BHCBX4-2&_user=10&_rdoc=1&_fmt=&_orig=search&_sort=d&view=c&_acct=C000050221&_version=1&_urlVersion=0&_userid=10&md5=a853d410a866732d3f8ab5dd3217d412 (accessed July 14, 2016). _____. 2005b. The impact of Webpage content characteristics on webpage visibility in search engine result (Part I). http://www.sciencedirect.com/science?_ob=ArticleURL&_udi=B6VC8-4BHCBX4-1&_user=10&_rdoc=1&_fmt=&_orig=search&_sort=d&view=c&_acct=C000050221&_version=1&_urlVersion=0&_userid=10&md5=33927751b92200b392f8c79b950dcdb1 (accessed July 14, 2016)