دوره 33، شماره 4 - ( تابستان 1397 )                   جلد 33 شماره 4 صفحات 1845-1864 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Soltani M, Nasiri J, Asgarian E. An automatic Persian text summarization system based on linguistic features and regression. Iranian Journal of Information Processing and Management. 2018; 33 (4) :1845-1864
URL: http://jipm.irandoc.ac.ir/article-1-3512-fa.html
سلطانی محمود، نصیری جلال الدین، عسگریان احسان. ارائه سیستم خلاصه ساز متون فارسی برمبنای ویژگی های زبان شناختی و رگرسیون. پژوهشنامه پردازش و مديريت اطلاعات. 1397; 33 (4) :1845-1864

URL: http://jipm.irandoc.ac.ir/article-1-3512-fa.html


پژوهشگاه علوم و فناوری اطلاعات (ایرانداک)
چکیده:   (320 مشاهده)
گسترش روزافزون داده­های متنی فارسی در فضای اینترنت و پیچیدگی جستجو در میان انبوه  این اسناد، خلاصه‌سازی خودکار متون فارسی را به یکی از زمینه ­های تحقیقاتی مورد توجه تبدیل کرده است. در این مقاله  روشی کارا برای خلاصه‌سازی خودکار متون فارسی ارائه شده است. روش پیشنهادی که به‌صورت انتخابی و تک سندی است، خلاصه‌سازی را بر اساس رتبه ­بندی جملات و انتخاب مهم‌ترین آنها انجام می­دهد. اهمیت هر جمله از متن با ترکیب خطی مقادیر هفت ویژگی زبان شناختی مستخرج از سند برای هر جمله بدست می­آید. وزن بهینه هر ویژگی در این ترکیب از روش رگرسیون خطی و با استفاده از پیکره آموزشی پاسخ محاسبه‌ شده است. پس از محاسبه اهمیت جملات متن، در هر مرحله از الگوریتم، یک جمله با اهمیت بیشتر تا رسیدن به نرخ فشرده سازی مورد نظر انتخاب می­شود. این جمله علاوه بر اینکه دارای بیشترین اهمیت است، دارای کمترین میزان شباهت با جملات انتخاب‌شده در مراحل قبلی نیز است. نتایج بدست آمده از مقایسه الگوریتم پیشنهادی با دو سیستم خلاصه‌ساز ایجاز و فارسی­ سام با استفاده از پیکره پاسخ، نشان می­ دهد در بیشتر معیارهای ارزیابی پیشرفت قابل توجهی حاصل ‌شده است. 
متن کامل [PDF 1172 kb]   (90 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: فناوري اطلاعات
دریافت: ۱۳۹۵/۱۱/۲۰ | پذیرش: ۱۳۹۶/۶/۲۸

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA code

ارسال پیام به نویسنده مسئول


تمام حقوق این وب سایت متعلق به پژوهشنامه پردازش و مدیریت اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2018 All Rights Reserved | Journal of Information processing and Management

Designed & Developed by : Yektaweb