تبیین فرانمای تولید داده‌های ساختارمند (اسکیماداتاُرگ) و تحلیل رویکرد آن به پردازش و سازماندهی اشیای محتوایی وب

نویسندگان

1 دانشگاه اصفهان

2 دانشگاه علامه طباطبائی

چکیده

هدف از پژوهش مفهومی حاضر، تبیین قابلیت‌ها، بستر معناشناختی و نگرش فرانمای تولید داده‌های ساختارمند بر روی وب به پردازش و سازماندهی اشیای محتوایی وب (موجودیت‌های داده‌ای) با رویکرد تحلیلی بود. برای گردآوری داده‌ها از روش‌ تحلیل اسنادی استفاده گردید. نتایج بررسی نشان داد که فرانمای تولید داده‌های ساختارمند بر روی وب، مجموعه‌ واژگان مشترکی است که برای توصیف و نشانه‌گذاری اشیای محتوایی وب و ایجاد داده‌های ساختارمند به‌منظور پردازش و سازماندهی بهتر استفاده می‌شود. این فرانما دارای ساختار و بستر معناشناختی خاصی است. ساختار آن نظیر یک هستی‌نگاشت برای نام‌گذاری نوع‌ها و صفات اشیای محتوایی، روابط‌ میان نوع‌ها و صفات، و قابلیت‌های چگونگی توصیف این صفات و روابط است. بستر معناشناختی آن نیز با نشانه‌گذارهای معنایی همچون ریزفرمت‌، ریزداده‌، RDFa 1.1، و JSON-LD سازگار است. دیگر نتایج پژوهش نشان داد که سه رویکرد عمده در پردازش و سازماندهی اشیای محتوایی در فرانمای تولید داده‌های ساختارمند بر روی وب به‌ شرح: رویکرد هستی‌شناسانه، بافت‌مدار، و آشیانه‌ای (تودرتو) وجود دارد. نتایج کلی پژوهش نشان داد که وجود رویکردهای مختلف در فرانمای تولید داده‌های ساختارمند بر روی وب، نشانگر دیدی جامع به اشیای محتوایی وب در عین توجه به بهبود میانکنش‌پذیری با موتورهای کاوش است. همچنین، تولید داده‌های ساختارمند با چنین فرانماهایی کمک شایان توجهی به تحقق وب معنایی یا وبِ داده‌ها دارد.

کلیدواژه‌ها


عنوان مقاله [English]

Methodology Explanation of Schema.org and Analysis of its Approach to the Processing and Organization of Web Content Objects

نویسندگان [English]

  • Morteza Mohammadi Ostani 1
  • Mozaffar Cheshmesohrabi 1
  • Ahmad Shabani 1
  • Asefe Asemi 1
  • Seyed Mahdi Taheri 2
چکیده [English]

The purpose of this conceptual research was to explain the capabilities, semantic platform and view point of Schema.org to processing and organization of web content objects (data entities) by analytical approach. To collect data documentary analysis was used. The research community included texts and researches related to the field of “structured data” and “Schema.org”. A total of 43 sources, as well as the official website of the “Schema.org” were selected using a purposive sampling method for analysis. The results of the survey showed that Schema.org is a common vocabulary that is used to describe and markup web content objects and create structured data for better processing and organization. It has a certain structure and semantic platform. Its structure is like an ontology for naming the types and properties of content objects, the relationships between types and properties, and the capabilities of describing these properties and relationships. Its semantic platform is adapted by semantic markups such as microformat, microdata, RDFa 1.1, and JSON-LD. The results of the research showed that there are three major approaches to the processing and organizing of content objects in the Schema.org: the ontological, context-oriented, and nesting approaches. Overall research results showed existence of different approaches to Schema.org represents a comprehensive view of the Web content objects while paying attention to improving interoperability with search engines. Also, the production of structured data with such schemata is an important contribution to the realization of semantic web or web of data.

کلیدواژه‌ها [English]

  • Schema.org
  • Semantic Web
  • Semantic Markup
  • Processing
  • Web Content Objects
  • Structured Data
  • Ontological Approach
  • Context-oriented Approach
  • Nested Approach