تحلیل زبان آذری مبتنی بر تقطیع به کمک گرامر پیوندی

نویسندگان

دانشگاه آزاد اسلامی واحد اهر

چکیده

انواع مختلفی از نظریه‌ها دربارۀ مشکل تقطیع نحوی و ایجاد دستور زبان‌های مربوط به زبان‌های طبیعی وجود دارند. این مقاله یک دستور زبان نحوی برمبنای صورت‌بندی دستور زبان رابطه‌ای برای زبان ترکی (آذری) که جزو زبان‌های پیوندی می‌باشد، ارائه می‌کند. در صورت‌بندی دستور زبان رابطه‌ای، کلمات یک جمله بر طبق نقش‌های نحوی که دارند به یکدیگر متصل می‌گردند. زبان ترکی (آذری) دارای ساخت واژه‌ای صرفی و اشتقاقی پیچیده می‌باشد و تکواژهای صرفی و اشتقاقی، نقش‌های نحوی مهمی در جملات بازی می‌کنند. به منظور طراحی نرم‌افزار دستور زبان رابطه‌ای برای زبان ترکی (آذری)، بخش‌های لغوی در بازنمایی ساخت واژه‌ای کلمات ترکی حذف شده‌اند و یال‌ها بر مبنای نشانه‌های ادات سخن و تکواژهای تصریفی در کلمات ایجاد می‌شوند. کلمات مشتق‌شده توسط مرزهای اشتقاقی از دیگر کلمات جدا می‌شوند . یک صورت‌بندی منحصربه‌فرد دستور‌ زبان رابطه‌ای تطابق‌یافته با زبان ترکی، دارای انعطاف‌پذیری لازم برای ایجاد ساخت‌های اتصال می‌باشد و در نهایت با استفاده از زبان برنامه‌نویسی دلفی، نرم‌افزار دستور زبان رابطه‌ای برای زبان آذری طراحی و اجرا گردید و سپس با انتخاب 250 جمله تصادفی، این نرم‌افزار مورد بررسی و آزمون قرارگرفت. برای 31/84% از جملات، نتیجۀ تقطیع‌کننده شامل تقطیع‌کننده‌های صحیح بود.

کلیدواژه‌ها


عنوان مقاله [English]

Analysis of Azari Language based on Parsing using Link Gram

نویسندگان [English]

  • Maryam Arabzadeh
  • Seyed Mehdi Araghi
چکیده [English]

There are different classes of theories for the natural lanuguage syntactic parsing problem and for creating the related grammars .This paper presents a syntactic grammar developed in the link grammar formalism for Turkish which is an agglutinative language. In the link grammar formalism, the words of a sentence are linked with each other depending on their syntactic roles. Turkish has complex derivational and inflectional morphology, and derivational and inflection morphemes play important syntactic roles in the sentences. In order to develop a link grammar for Turkish, the lexical parts in the morphological representations of Turkish words are removed, and the links are created depending on the part of speech tags and inflectional morphemes in words. Furthermore, a derived word is separated at the derivational boundaries in order to treat each derivation morpheme as a special distinct word, and allow it to be linked with the rest of the sentence. The derivational morphemes of a word are also linked with each other with special links to indicate that they are parts of the same word. Finally the adapted unique link grammar formalism for Turkish provides flexibility for the linkage construction, and similar methods can be used for other languages with complex morphology. Finally, using the Delphi programming language, the link grammar related to the Azeri language was developed and implemented and then by selecting 250 random sentences, this grammar is evaluated and then tested. For 84.31% of the sentences, the result set of the parser contains the correct parse.

کلیدواژه‌ها [English]

  • parsing
  • link grammar
  • natural language process
  • Morphological analysis
  • Delphi programming language