پیوند های کور، چالشی در ایده داده‌های پیوندی: واکاوی سرعنوان‌ های موضوعی فارسی

نویسنده

دانشگاه فردوسی مشهد

10.35050/JIPM010.2014.008

چکیده

در این نوشتار ضمن طرح ایده داده‌های پیوندی، رویکرد انتشار، اشتراک و برقراری پیوند میان پاره‌های داده‌، اطلاعات و دانش در وب معنایی، بخشی از اشکالات احتمالی در تبدیل رکوردهای مستند سرعنوانهای موضوعی فارسی به داده‌های پیوندی با روش پیمایشی شناسایی شد. 11233 رکورد مستند موضوع فارسی در سه نظام – فهرست پیوسته کتابخانه ملی ایران، فهرست پیوسته کتابخانه کنگره و گنجینه کتاب‌های نوسا – مورد کاوش قرار گرفت و چگونگی برقراری پیوند میان موضوعات فارسی و انگلیسی در 9519 رکورد مشترک در فارسی و کنگره، ثبت گردید. نتایج نشانگر آن است که برقراری پیوند میان موضوعات فارسی و انگلیسی در 20 درصد رکوردها با خطا مواجه می‌شود. بیش‌ترین بروز خطا مربوط به نامشخص بودن نظام موضوعی (6/7%) در پایگاه مستند موضوعی کتابخانه ملی ایران است. پیشنهاد می‌شود جهت تبدیل صحیح و فراهم ساختن امکان پیوند میان موضوعات فارسی و انگلیسی، قبل از تبدیل رکوردهای مستند موضوع به داده‌های پیوندی، خطاهای موجود در جریان پیش‌پردازش‌ها شناسایی و برطرف گردد.

کلیدواژه‌ها


عنوان مقاله [English]

Blind links, a big challenge in the linked data idea: Analysis of Persian Subject Headings

نویسنده [English]

  • Atefeh Sharif
چکیده [English]

In this survey, Linked data concept as exposing, sharing, and connecting pieces of data, information, and knowledge on the Semantic Web and some potential problems in converting Persian subject headings (PSHs) Records into linked data were discussed. A data set (11233 records) of PSHs was searched in three information retrieval systems including National Library of Iran (NLI) online catalog, Library of Congress (LC) online catalog and NOSA books. Correct links between Persian and English subject headings in the 9519 common records of two catalogs were recorded. The results indicate that the links between Persian and English subjects in 20% of records were failed. The maximum error was associated with the anonymous databases (6/7 %) in NLI online catalog. It is recommended to preprocess the PSHs records before any conversion projects. It seems that, during the preprocessing, the potential errors could be identified and corrected.

کلیدواژه‌ها [English]

  • linked data
  • Semantic Web
  • Persian Subject Headings (PSHs)
  • Library of Congress Subject Headings (LCSHs)
  • Nosa books