شناسایی چالش‌های برگردان اسامی فارسی به انگلیسی در پایگاه وب آو ساینس

نویسندگان

1 دانشگاه شیراز

2 دانشکده زبان‌های خارجی و زبان‌شناسی ، دانشگاه شیراز

چکیده

هدف پژوهش حاضر، شناخت چالش‌های برگردان نام‌های فارسی به انگلیسی و فراوانی این چالش‌ها در پایگاه «وب‌آو‌ساینس» است. این پژوهش به ‌لحاظ هدف، کاربردی و از نظر نحوه گردآوری داده‌ها، کمّی از نوع پیمایشی است. جامعه پژوهش شامل نام‌های نویسندگان ایرانی در پایگاه »وب‌آوساینس» است که در بازه زمانی هفت‌ساله 2010 تا 2017 مقاله انگلیسی نگاشته‌اند. تعداد 3110873 نام در ابتدا بازیابی شد که پس از پالایش و یکدست‌سازی اسامی به 11242 نام تقلیل یافت. به‌منظور پالایش، آماده‌سازی و تحلیل داده‌ها از نرم‌افزار «بیب‌اکسل»، «اکسل» و پایگاه «وب‌آوساینس» استفاده شد. یافته‌های پژوهش نشان داد که در برگردان نام‌ها از فارسی به انگلیسی چهار گروه چالش‌های مربوط به «همخوان‌ها»، چالش‌های مربوط به «واکه‌ها»، چالش‌های مربوط به «حذف یا تکرار حروف»، و چالش‌های «تلفظی» وجود دارد. در دسته اول، چالش‌های همخوان‌ها، نویسندگان و نگارندگان در برگردان نام‌ها در یازده حرف (8 واج)، شامل حروف ق، غ، ژ، ع، و، ک، ج، ک، ث، س، ص، صورت‌های مختلف نگارشی داشته‌اند. در دسته دوم، چالش واکه‌ها، صورت‌های نگارشی مختلفی در برگردان واکه‌های (/i/‌، /u/، توالی واج های /e/ و/j/ ، /o/ ) و پایانه ‌(ـِه) از فارسی به انگلیسی مشاهده شد. در دسته سوم، وجود حروف مشدد و حروف (ال) در برخی نام‌ها موجب به‌وجود آمدن چندگانگی در نگارش نام‌ها شده ‌است. و در نهایت، در در دسته آخر، آواهای اَ و اِ، و همچنین حذف برخی حروف به‌علت تفاوت در تلفظ نام‌ها در گویش‌ها و زبان‌های مختلف دچار چندگانگی شده‌اند. با توجه به اهمیت بازیابی اسامی در جست‌وجوی نویسندگان و همچنین در ارزیابی پژوهش، راهکارهایی همچون استفاده از عملگر‌های بولی و نویسه جایگزین بین صورت‌های نگارشی غالب، ایجاد ساندکس زبان فارسی، مجهز‌کردن پایگاه به ابزارهای دانشی ویژه نام جهت یکدستی در برگردان نام‌ها ضرورت دارد.

کلیدواژه‌ها


عنوان مقاله [English]

The Challenges of Transliteration of Persian Names to English, and their Impact on the Recall of Web of Science’s Retrieved Results

نویسندگان [English]

  • Mahsa Kaveh 1
  • Mahdieh Mirzabeigi 1
  • Hajar Sotudeh 1
  • Amirsaeid Moloodi 2
1
2
چکیده [English]

The present study investigated the challenges of transliteration of Persian names to English ones, and the impact of these challenges on the recall of web of science’s retrieved results. This study is applied in terms of objectives and quantitative (i.e., survey) in terms of data collection procedure. The population included the names of Iranian authors who had published an English article in Web of Science between 2010 and 2017. First of all, 3110873 names were retrieved. It was reduced to 11, 242 after homogenization process. Data was collected through Bibexcel and Excel software and Web of Science database. The findings showed that there were three types of challenges (i.e., vowels, consonants, and omitted or double consonants) in transliteration of Persian names to English ones. They resulted in non-homogenous and different written forms. In addition, the results of Chi-square test showed that the frequency of all forms of the mentioned challenges had a significant effect on the recall of the retrieved results. Considering the importance of retrieving the names in retrieval studies as well as research studies’ evaluation, some solutions such as using Boolean operators and wildcards between the prevailing typographical forms, creating Persian soundex, and equipping the database with the thesaurus are suggested.
 

کلیدواژه‌ها [English]

  • Recall
  • information retrieval
  • Studies’ Evaluation
  • Transliteration of Persian Names to English
  • Names Transliteration Challenges