[صفحه اصلی ]   [Archive] [ English ]  
irandoc irandoc irandoc irandoc irandoc
:: ::
برگشت به فهرست مقالات برگشت به فهرست نسخه ها
بهبود خلاصه سازی خودکار متون فارسی با استفاده از روش‌های پردازش زبان طبیعی و گراف شباهت(95/11/13)
طیبه حسینی خواه ، عباس احمدی، آزاده محبی
کارشناسی ارشد دانشگاه صنعتی امیرکبیر
چکیده:   (1215 مشاهده)

بخش قابل توجهی از اطلاعات قابل دسترس در پایگاه داده­های متنی ذخیره شده­است که شامل مجموعه بزرگی از اسناد و  منابع مختلف (مانند مقالات خبری، کتاب­ها، ایمیل­ها و صفحات وب) است. افزایش چشمگیر این نوع اطلاعات، وجود ابزارهایی برای ارزیابی خودکار منابع متنی را بیش از هر زمان دیگری آشکار می­کند. در این میان خلاصه­سازی خودکار متون یکی از راهکارهایی است که از اتلاف وقت کاربران می­کاهد. خلاصه­سازی استخراجی به معنای انتخاب مهمترین جملات یک متن با هدف کوتاه نمودن آن است به شکلی که اطلاعات مهم متن ورودی را در بر داشته باشد. در این پژوهش با بکارگیری و ترکیب روش‌های پردازش زبان طبیعی دقت خلاصه­های استخراجی بهبود می‌یابد و و روشی برای  اصلاح الگوریتم‌ها و معیارهای امتیازدهی به جملات، ارائه می‌شود. در روش پیشنهادی برای  امتیازدهی به کلمات، از برچسب نقش دستوری کلمات در جمله به عنوان ضریب اهمیت کلمات استفاده می‌شود که در نتیجه با  انتخاب بهتر کلمات و جملاتی که بار محتوایی بیشتری دارند، باعث دقت خلاصه‌سازی افزایش می‌یابد. علاوه برآن، برای انتخاب جملات مناسب از متن، ازروش‌های مبتنی بر گراف شباهت بکارگرفته می‌شود به‌گونه‌ای که  با تغییر وزن جملات انتخاب شده  در پیمایش گراف، در هر گام  چالش افزونگی اطلاعات برطرف می‌شود.در نهایت نتایج بدست آمده با معیارهای استانداردی مانند «بازخوانی» و «دقت» و بر روی یک پیکره متنی استاندارد فارسی نیز ارزیابی می‌شود.

واژه‌های کلیدی: خلاصه سازی استخراجی، پردازش زبان طبیعی، برچسب گذاری دستوری کلمات، گراف شباهت
متن کامل [PDF 1153 kb]   (592 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: فناوري اطلاعات
دریافت: ۱۳۹۴/۲/۳ | پذیرش: ۱۳۹۵/۱۰/۱۹ | انتشار: ۱۳۹۵/۱۱/۱۳
ارسال پیام به نویسنده مسئول

ارسال نظر درباره این مقاله
نام کاربری یا پست الکترونیک شما:

کد امنیتی را در کادر بنویسید >



XML   English Abstract   Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Hosseinikhah T, Ahmadi A, Mohebi A. A new Persian Text Summarization Approach based on Natural Language Processing and Graph Similarity. Journal of Information Processing and Management. 2009;
URL: http://jipm.irandoc.ac.ir/article-1-2842-fa.html
حسینی خواه طیبه، احمدی عباس، محبی آزاده. بهبود خلاصه سازی خودکار متون فارسی با استفاده از روش‌های پردازش زبان طبیعی و گراف شباهت(95/11/13). پژوهشنامه پردازش و مديريت اطلاعات. 1388;

URL: http://jipm.irandoc.ac.ir/article-1-2842-fa.html

برگشت به فهرست مقالات برگشت به فهرست نسخه ها
پژوهشنامه پردازش و مدیریت اطلاعات Journal of Information processing and Management
نقشه پايگاه | پرسش‌هاي متداول | اطلاع‌رساني به دوستان | آمار پايگاه | حقوق | مسئوليت محتوا | روزآوري: ۱۳۹۶/۶/۲۹
كليه حقوق براي فصل‌نامه پردازش و مديريت اطلاعات محفوظ است.
Persian site map - English site map - Created in 0.118 seconds with 848 queries by yektaweb 3470