ارائه یک روش ساختارمند در اندازه‌گیری و تحلیل کیفیت اطلاعات پایان‌نامه‌ها و رساله‌های درون کشور

نویسندگان

1 پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)، تهران؛ ایران

2 گروه مهندسی صنایع، دانشکده فنی‌مهندسی، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات، تهران، ایران

چکیده

امروزه، اندازه‌گیری کیفیت داده یکی از مهم‌ترین راهبردها در بهبود فرایندهای کسب‌وکارهای داده‌محور به حساب می‌آید. هرگونه تصمیم درست برای بهبود سیستم‌ها در این دسته از سازمان‌ها به یک تحلیل مناسب از کیفیت داده‌ها وابسته است. داده‌های پژوهشی و به‌ویژه، پایان‌نامه/ رساله‌ها (پارساها)ی دانش‌آموختگان کل کشور بر پایه همین اصل از جنبه‌های گوناگون کیفیت داده نیازمند بررسی و ارزیابی است. در فرایند ثبت «پارسا»ها کنترل کیفیت فراداده‌ها یکی از مهم‌ترین بخش‌هاست که به بررسی اقلام اطلاعاتی مدارک (مانند نام پژوهشگر، استادان راهنما و مشاور، چکیده، فهرست و ...) می‌پردازد. در وضعیت موجود، مدارک ناهمخوان در فرایند کنترل کیفیت شناسایی شده و مدرک مربوطه پس از درج در سامانه (به‌صورت متن) به‌صورت سیستمی به پژوهشگر برگردانده می‌شود. استاندارد نبودن ناهمخوان‌های شناسایی‌شده و نبودِ دسته‌بندی مناسب برای مدارک ناهمخوان به اطلاع‌رسانی سلیقه‌ای به پژوهشگران منجر شده، تحلیل‌های آماری از مشکلات کیفی فراداده‌ها را با دشواری روبه‌رو ساخته، و تحلیل ریشه‌ای خطاهای مشاهده‌شده را ناممکن می‌سازد. ‌از این ‌رو، در این پژوهش ساختار ناهمخوان‌های مشاهده‌شده پس از استاندارد شدن به‌صورت آزمایشی در دوره‌های دوماهه استفاده شده و نتایج آن ارائه شده است. ناهمخوانی در تاریخ دفاع، صفحه عنوان (فارسی و انگلیسی) و وجود صفحه‌های سفید در فایل «پارسا» از جمله مهم‌ترین دلایل بازگرداندن مدارک به کاربران بوده است. همچنین، تحلیل همه داده‌ها نشان داد که ۵۹ درصد از ناهمخوانی‌ها به فایل‌های ضمیمه‌شده و ۴۱ درصد به اطلاعات ثبت‌شده در سامانه مربوط می‌شود. در نهایت، بر پایه تحلیل‌های انجام‌شده، رهنمودهایی به‌منظور بهبود کیفیت داده‌ها به ‌تفکیک حوزه‌های تخصصی برای کاربران سامانه ارائه شده است

کلیدواژه‌ها


عنوان مقاله [English]

Providing a structural methodology for measuring and analyzing the quality of theses and dissertations in the country.

نویسندگان [English]

  • Mohammad Javad Ershadi 1
  • Masoumeh Nabizadeh 2
چکیده [English]

Today, measuring data quality is one of the most important strategies in improving data-driven business processes. Any correct decision to improve systems in this category of organizations depends on an appropriate analysis of data quality. Research data and especially theses/ dissertations of graduates of the whole country based on this principle from various aspects of data quality need to be reviewed and evaluated. In the process of registering, the quality control of metadata is one of the most important parts that examines the information items of documents (such as the name of the researcher as well as supervisors and advisors, abstract, index, etc.). In the current situation, incompatible documents are identified during the quality control process and after entering in the system (as text), the relevant document is systematically returned to the researcher. Lack of a standard framework for identified non-conformities besides absence of an appropriate partitioning, make statistical analysis of metadata quality problems difficult, and also make it impossible to analyze the root of observed errors. Therefore, in this study, the incompatible structure observed after standardization has been used experimentally in two-month periods and the results have been presented. Incompatible in thesis defense date, the title page (Persian and English) and the existence of white pages in the file have been among the most important reasons for returning documents to users. Also, the analysis of all data showed that 59% of the incompatibles were related to the attached files and 41% to the information recorded in the system. Finally, based on the performed analysis, guidelines have been provided for the users of the system in order to improve the quality of data, according to specialized areas

کلیدواژه‌ها [English]

  • Data quality
  • information quality
  • quality control
  • Iranian Research Institute for Information Science and Technology (IranDoc)
  • Theses/ Dissertations Registration System
  • Incompatible Analysis