دوره 33، شماره 2 - ( زمستان 1396 )                   جلد 33 شماره 2 صفحات 914-885 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Hosseinikhah T, Ahmadi A, Mohebi A. A new Persian Text Summarization Approach based on Natural Language Processing and Graph Similarity. .... 2018; 33 (2) :885-914
URL: http://jipm.irandoc.ac.ir/article-1-2842-fa.html
حسینی خواه طیبه، احمدی عباس، محبی آزاده. بهبود خلاصه‌سازی خودکار متون فارسی با استفاده از روش‌های پردازش زبان طبیعی و گراف شباهت. پژوهشنامه پردازش و مديريت اطلاعات. 1396; 33 (2) :914-885

URL: http://jipm.irandoc.ac.ir/article-1-2842-fa.html


دانشگاه صنعتی امیرکبیر
چکیده:   (9966 مشاهده)

بخش قابل توجهی از اطلاعات قابل دسترس در پایگاه داده­‌های متنی ذخیره شده­است که شامل مجموعه بزرگی از اسناد و  منابع مختلف (مانند مقالات خبری، کتاب­‌ها، ایمیل­‌ها و صفحات وب) است. افزایش چشمگیر این نوع اطلاعات، وجود ابزارهایی برای ارزیابی خودکار منابع متنی را بیش از هر زمان دیگری آشکار می­‌کند. در این میان خلاصه­‌سازی خودکار متون یکی از راهکارهایی است که از اتلاف وقت کاربران می­‌کاهد. خلاصه­‌سازی استخراجی به معنای انتخاب مهمترین جملات یک متن با هدف کوتاه نمودن آن است به شکلی که اطلاعات مهم متن ورودی را در بر داشته باشد. در این پژوهش با بکارگیری و ترکیب روش‌های پردازش زبان طبیعی دقت خلاصه­‌های استخراجی بهبود می‌یابد و و روشی برای  اصلاح الگوریتم‌ها و معیارهای امتیازدهی به جملات، ارائه می‌شود. در روش پیشنهادی برای  امتیازدهی به کلمات، از برچسب نقش دستوری کلمات در جمله به عنوان ضریب اهمیت کلمات استفاده می‌شود که در نتیجه با  انتخاب بهتر کلمات و جملاتی که بار محتوایی بیشتری دارند، باعث دقت خلاصه‌سازی افزایش می‌یابد. علاوه برآن، برای انتخاب جملات مناسب از متن، ازروش‌های مبتنی بر گراف شباهت بکارگرفته می‌شود به‌گونه‌ای که  با تغییر وزن جملات انتخاب شده  در پیمایش گراف، در هر گام  چالش افزونگی اطلاعات برطرف می‌شود.در نهایت نتایج بدست آمده با معیارهای استانداردی مانند «بازخوانی» و «دقت» و بر روی یک پیکره متنی استاندارد فارسی نیز ارزیابی می‌شود.

متن کامل [PDF 1167 kb]   (3857 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: فناوري اطلاعات
دریافت: 1394/2/3 | پذیرش: 1395/10/19 | انتشار: 1395/11/13

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

تمام حقوق این وب سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2022 CC BY-NC 4.0 | Iranian Journal of Information processing and Management

Designed & Developed by : Yektaweb