نمایه‌ساز ماشینی منابع فارسی: مدلی یک‌پارچه برای پژوهشگاه علوم و فناوری اطلاعات ایران

نویسندگان

10.35050/JIPM010.2014.041

چکیده

نمایه سازی ماشینی به گونه ای از نمایه سازی گفته می شود که در آن با
استفاده از الگوریتم رایانه ای، واژه های کلیدی یک مدرک از عنوان یا متن،
استخراج و سپس به شکل مدخل های نمایه مرتب و سازمان دهی می شوند . با
وجود نیاز روزافزون به کاربرد رایانه در نمایه سازی، تاکنون برای زبان فارسی،
نمایه ساز ماشینی ساخته نشده است . از این رو در این مقاله نتیجه بررسی و
شناخت جنبههای علمی و عملیاتی این سیستم نمایهسازی در پژوهشگاه علوم و
فناوری اطلاعات ایران ارائه می شود که بر پایه مأموریت و دانش سازمانی خود
یکی از آماده ترین بسترها را برای ساخت اینگونه نمایه ساز دارد. به این منظور،
ابتدا به پیوند میان نمایه سازی و بازیابی اطلاعات، مباحث نظری و سیر تحول
نمایه سازی ماشینی، نمایه سازی ماشینی از دیدگاه های عملیاتی و فرایندی،
پروژه های موفق نمایه سازی به زبان های گوناگون در دنیا پرداخته شده و
نیازمندیهای نمایه ساز ماشینی برای زبان فارسی توصیف شده است . سپس
اجزای یک نمایه ساز برای زبان فارسی تشریح و مدل مفهومی نمایه ساز ماشینی
و همچنین روابط میان اجزا، جزئیات زیرسیستم ها، و مدل مفهومی سیستم
طراحی شده اند. در پایان، نیازمندی های ساخت نمایه ساز ماشینی برای این
پژوهشگاه به بحث گذاشته شده است و وضعیت پروژه های انجام شده و
تجربه های موجود در این زمینه نیز تبیین شده اند.

کلیدواژه‌ها


عنوان مقاله [English]

Machine Indexer for Persian Resources: An Integrated Model for the Iranian Research Institute for Information Science and Technology

نویسندگان [English]

  • Ammar Jalalimanesh
  • Sirous Alidousti
  • Mahmood Khosrojerdi
چکیده [English]

Machine indexer is referred to as a kind of indexing
system in which keywords are extracted from the title or body of a
text and organized in the index entries using computer algorithm.
Althogh there is an increasing need for applying computer in indexing
machine indexer has not been developed for Persian language yet.
Therefore in this paper the results of investigating and identifying of
theoretical and practical aspects of such system in the Iranian
Research Institute for Information Science and Technology are
presented. To do so, firstly the relationship between indexing and
information retrieval, theoretical debates and the machine indexing
revolution, the practical and procedural viewpoints of machine
indexing, successful projects in different countries and for different
languages, and the requirements of machine indexer for Persian
language are discussed. Then the elements of a machine indexer for
Persian language are defined and its conceptual model and also the
relationships between the elements, the details of subsystems, and the
indexer logical system are designed. Finally, the requirments of
developing the system for the Iranian Research Institute for Information Science and Technology are discussed and the state of the art of the
implemented projects and existing experiences in this regard are defined.

کلیدواژه‌ها [English]

  • Indexing
  • Machine indexing
  • UML
  • Conceptual model
  • Iranian Research Institute for Information Science and Technology