بررسی کارآمدی روش‌های موجود در بازیابی اطلاعات بین ‌زبانی فارسی- انگلیسی با استفاده از واژه‌نامه دوزبانه ماشین‌خوان

نویسندگان

1 استادیار مرکز منطقه‌ای اطلاع‌رسانی علوم و فناوری

2 دانشیار دانشگاه فردوسی مشهد

چکیده

در این پژوهش میزان تأثیر انجام پردازش‌های زبان طبیعی بر روی ترجمه عبارت‌های جستجو با آزمون فرضیه‌های پژوهش مشخص گردید. فنون پردازش زبان طبیعی که برای پردازش عبارت‌های جستجو به کار گرفته شد شامل قطعه‌بندی متن، شناخت گونه‌های زبانشناختی، حذف سیاهه بازدارنده، تحلیل مورفولوژیک، و برچسب‌زنی انواع نقش دستوری بود. آزمون فرضیه اول نشان داد که استفاده از روش ترجمه اولین برابرنهاده در مقایسه با شیوه انتخاب همه برابرنهاده‌ها موجب کارآمدی بیشتر در بازیابی می‌گردد. آزمون فرضیه دوم نشان داد که اگرچه تحلیل مورفولوژیک واژه‌هایی که به وسیله واژه‌نامه ترجمه نشدند باعث افزایش ضریب دقت بازیافت می‌گردد، اما تفاوت معناداری با عدم انجام این تحلیل ایجاد نمی نماید. بررسی فرضیه سوم نیز نشان داد که ترجمه عبارتی در مقایسه با ترجمه واژه به واژه باعث کارآمدی بیش‌تر می‌گردد. یافته‌های دیگر این پژوهش نیز نشان داد که دگرنویسی واژه‌های فارسی ترجمه‌ناپذیر با حروف انگلیسی و قرار دادن آن‌ها در عبارت جستجوی نهایی در مقایسه با حذف آن‌ها از عبارت‌های جستجو، می‌تواند منجر به افزایش کارآمدی گردد.

کلیدواژه‌ها


عنوان مقاله [English]

Available Methods in Farsi-English Cross Language Information Retrieval Using Machine-readable, Bilingual Glossary

نویسندگان [English]

  • Hamid Alizadeh 1
  • Rahmatullah Fattahi
  • Mohammad Reza Davar panah 2
چکیده [English]

In this paper the impact scope of Natural Language Processing (NLP) on translating search statements was determined by testing out research hypotheses. The NLP techniques employed for search statement processing included text parsing, linguistic forms identification, stopword removal, morphological analysis, and tokenization. Examination of the hypotheses indicated that using the method of translating the first equivalent term selected versus the method of selecting all equivalent terms, would contribute to increased efficiency of the review that while morphological analysis of the terms not translated by the glossary, would increase the retrieval precision cutoff, there would be no significant difference established by the lack of such analysis thereof that sentence translation as opposed to term by term translation, would increase the efficiency of Farsi-English proofreading. Other findings are also represented.

کلیدواژه‌ها [English]

  • Cross Language Information Retrieval
  • Natural Language Processing
  • Machine Readable Bilingual Dictionary
  • Information Retrieval Evaluation