[صفحه اصلی ]   [Archive] [ English ]  
irandoc irandoc irandoc irandoc irandoc
:: ::
برگشت به فهرست مقالات برگشت به فهرست نسخه ها
ارائه سیستم خلاصه ساز متون فارسی برمبنای ویژگی های زبان شناختی و رگرسیون(97/05/02)
محمود سلطانی، جلال الدین نصیری ، احسان عسگریان
استادیار پژوهشگاه علوم و فناوری اطلاعات (ایرانداک)
چکیده:   (79 مشاهده)
گسترش روزافزون داده­های متنی فارسی در فضای اینترنت و پیچیدگی جستجو در میان انبوه  این اسناد، خلاصه‌سازی خودکار متون فارسی را به یکی از زمینه ­های تحقیقاتی مورد توجه تبدیل کرده است. در این مقاله  روشی کارا برای خلاصه‌سازی خودکار متون فارسی ارائه شده است. روش پیشنهادی که به‌صورت انتخابی و تک سندی است، خلاصه‌سازی را بر اساس رتبه ­بندی جملات و انتخاب مهم‌ترین آنها انجام می­دهد. اهمیت هر جمله از متن با ترکیب خطی مقادیر هفت ویژگی زبان شناختی مستخرج از سند برای هر جمله بدست می­آید. وزن بهینه هر ویژگی در این ترکیب از روش رگرسیون خطی و با استفاده از پیکره آموزشی پاسخ محاسبه‌ شده است. پس از محاسبه اهمیت جملات متن، در هر مرحله از الگوریتم، یک جمله با اهمیت بیشتر تا رسیدن به نرخ فشرده سازی مورد نظر انتخاب می­شود. این جمله علاوه بر اینکه دارای بیشترین اهمیت است، دارای کمترین میزان شباهت با جملات انتخاب‌شده در مراحل قبلی نیز است. نتایج بدست آمده از مقایسه الگوریتم پیشنهادی با دو سیستم خلاصه‌ساز ایجاز و فارسی­ سام با استفاده از پیکره پاسخ، نشان می­ دهد در بیشتر معیارهای ارزیابی پیشرفت قابل توجهی حاصل ‌شده است. 
واژه‌های کلیدی: خلاصه‌سازی تک سندی، زبان فارسی، ویژگی های زبان شناختی متن، رگراسیون خطی، ارزشیابی خلاصه‌ساز
متن کامل [PDF 789 kb]   (18 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: فناوري اطلاعات
دریافت: ۱۳۹۵/۱۱/۲۰ | پذیرش: ۱۳۹۶/۶/۲۸
ارسال پیام به نویسنده مسئول

ارسال نظر درباره این مقاله
نام کاربری یا پست الکترونیک شما:

CAPTCHA code


XML   English Abstract   Print



برگشت به فهرست مقالات برگشت به فهرست نسخه ها
پژوهشنامه پردازش و مدیریت اطلاعات Journal of Information processing and Management
1cd1b69edf77ec3
نقشه پايگاه | پرسش‌هاي متداول | اطلاع‌رساني به دوستان | آمار پايگاه | حقوق | مسئوليت محتوا | روزآوري: ۱۳۹۷/۴/۴
كليه حقوق براي فصل‌نامه پردازش و مديريت اطلاعات محفوظ است.
Persian site map - English site map - Created in 0.28 seconds with 36 queries by YEKTAWEB 3735