دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد تهران جنوب
چکیده: (1244 مشاهده)
شناسایی موجودیتهای اسمی به عنوان یک وظیفه پایهای در حوزه پردازش زبان طبیعی و به طور کلی زیر مجموعهای از استخراج اطلاعات است. در فرآیند شناسایی موجودیتهای اسمی به دنبال مکانیابی عناصر اسمی در متن و دستهبندی آنها به ردههایی از پیش تعیین شده از قبیل اسامی اشخاص، سازمانها، مکانها، عبارتهای زمانی، و غیره هستیم. هرچند پژوهشهایی گسترده در توسعه سیستمهای شناسایی موجودیتهای اسمی در حوزه زبان انگلیسی درطی سالهای پیشین انجام گرفته است، متاسفانه با توجه به مشکلات موجود، مانند نبود پیکرههای متنی نشانهگذاری شده استاندارد در زبان فارسی، پژوهشهای بسیار محدودی در زبان فارسی وجود دارد. در این مقاله با بررسی پژوهشهای انجام گرفته در دیگر زبانها و با بهرهگیری از روشهای تازه در این حوزه همانند استفاده از نمایش بردارهای عددی برای کلمات، به توسعه سیستمی برای شناسایی موجودیتهای اسمی بر پایه شبکه عصبی پرداخته شده است. نتایج بدست آمده از مدل پیشنهادی نشان دهنده این واقعیت است که استفاده از مدلهای نمایش بردارهای عددی برای کلمات در زبان فارسی، افزون بر مرتفع کردن مشکل انتخاب ویژگیها، میتواند به توسعه سیستمی کارآمد منجر شود که کمترین وابستگی را نیز به دامنه دارد.
Zali M, Firoozbakht M. Named entities recognition and classification system for Persian texts based on neural network. Journal of Information Processing and Management. 2009; URL: http://jipm.irandoc.ac.ir/article-1-3385-fa.html
زالی مجتبی، فیروزبخت محسن. سیستم شناسایی و طبقهبندی موجودیتهای اسمی در متون زبان فارسی بر پایه شبکه عصبی(96/05/23). پژوهشنامه پردازش و مديريت اطلاعات. 1388;