هدف: این پژوهش با هدف تشریح مشکلات عمده نوشتاری و معنایی زبان فارسی در استفاده از محیطهای اطلاعاتی و تعیین میزان انطباق و توجه به این ویژگیها هنگام جستجو و بازیابی در پایگاههای اطلاعاتی فارسی انجام شد.
روش: این پژوهش به روش پیمایشی-تحلیلی و با استفاده از شیوه مشاهده مستقیم انجام گرفت. پس از مرور پژوهشهای مرتبط، کلیدواژههای کاوش در قالب یک سیاهه شکل گرفت. هریک از این کلیدواژهها در پایگاههای اطلاعاتی مورد مطالعه شامل پژوهشگاه علوم و فناوری اطلاعات ایران، پایگاه استنادی علوم جهان اسلام، پایگاه مجلات تخصصی نور و پایگاه اطلاعات علمی جهاد دانشگاهی جستجو و تعداد نتایج بازیابی شده ثبت گردید. سپس به بررسی میزان انطباق پایگاههای اطلاعاتی با این ویژگیها پرداخته شد.
یافتهها: برخی ویژگیهای نوشتاری و معنایی زبان فارسی سبب بروز مشکلاتی در بازیابی اطلاعات از پایگاههای اطلاعاتی منتخب میشوند. مواردی مانند پیوستهنویسی و جدانویسی واژگان مشتق، مرکب و مشتق-مرکب، گوناگونی جمعها، واژگان دخیل و معادل آنها در بخش نوشتاری و چندمعنایی، همنامی و .... در بخش معنایی از این دست ویژگیها هستند. فقدان پوشش مناسب ویژگیهای یاد شده در مراحل ذخیرهسازی و پردازش و عدم آگاه نمودن کاربر از آن، جهت اصلاح فرایند کاوش در مرحله بازیابی اطلاعات در پایگاههای اطلاعاتی مورد پژوهش، اثرات نامطلوبی بر فرایند کاوش و بازیابی دارد.
نتیجهگیری: یافتهها نشان داد که پایگاههای اطلاعاتی فارسی نسبت به ویژگیهای نوشتاری و معنایی زبان فارسی توجه کافی نداشته و بسیاری از ویژگیهای آنرا در مراحل ذخیرهسازی و پردازش اطلاعات نادیده میگیرند. با توجه به تأثیر این ویژگیها در تعامل کاربران با پایگاههای اطلاعاتی، احتیاج کاربران فارسیزبان به ابزارهای کاوش بومی و پایگاههای اطلاعاتی که مبتنی بر ویژگیهای زبانیِ خودشان طراحی شده باشد، بیش از پیش احساس میشود. پژوهش حاضر با بررسی میزان توانایی پایگاههای اطلاعاتی فارسیزبان در پوشش برخی ویژگیهای این زبان که در فرایند جستجو و بازیابی تأثیر قابل توجهی دارند، نقاط ضعف و قوت این پایگاهها را مشخص نموده و نتایج آن میتواند در جهت بهبود و اصلاح عملکرد پایگاههای مذکور مورد استفاده قرار گیرد.
Homavandi H, Norouzi Y, Hoseine Beheshti M S. Survey of Information Searching and Retrieving Challenges in Databases in Connection with Persian Language Writing Features. Journal of Information Processing and Management. 2009; URL: http://jipm.irandoc.ac.ir/article-1-3254-fa.html
هماوندی هدی، نوروزی یعقوب، حسینی بهشتی ملوک السادات. بررسی مشکلات جستجو و بازیابی اطلاعات در پایگاههای اطلاعاتی از جنبه ویژگیهای نگارشی زبان فارسی(95/12/08). پژوهشنامه پردازش و مديريت اطلاعات. 1388;