راهکاری جدید برای انجام پرس‌وجوهای فازی بر روی پایگاه‌داده‌های گرافی NoSQL

نویسندگان

گروه ریاضی و علوم رایانه؛ دانشگاه علامه طباطبایی

چکیده

امروزه به‏‌دلیل حجم انبوه اطلاعات از پایگاه ‏داده‏‌های NoSQLئ برای محاسبه داده‏‌های پیچیده استفاده‏ می‏‌شود. این پایگاه داده‏‌ها با قابلیت ذخیره داده‏‌های نیمه‏‌ساختاریافته و بدون ساختار برای مدیریت داده‏‌های بزرگ مورد استفاده قرار‏ می‏‌گیرد. در این مقاله پرس‏‌وجوهای فازی توسط کاربران بر روی اطلاعات ذخیر‏شده در پایگاه‏ داده گراف Neo4j انجام شده است که منجر به نمایش نتایج به‏‌صورت غیرفازی‏ می‏‌شود. برای ارزیابی کارایی روش پیشنهادی با در نظر گرفتن یک پایگاه داده از داده‏‌های مربوط به یک شرکت قطعه‏‌سازی، دو متغیر قیمت و کیفیت با ویژگی فازی در نظر گرفته شد و از آن‏ها برای تعریف و اجرای پرسش‏‌های فازی استفاده شد که نتایج می‏‌تواند صحت عملکرد روش پیشنهادی را تأیید کند. علاوه‎ بر این، یک مشاور که دارای اطلاعات در مورد داده‏‌هاست، اصطلاح‏‌های فازی، توابع عضویت، و جدول قوانین فازی را تعریف‏ می‏‌کند.
یکی از فرایندهای مهم در این روش یافتن مرکز ثقل به‏‌منظور غیرفازی‌‏سازی نتیجه نهایی است که برای این منظور الگوریتمی با زبان برنامه‌‏نویسی #C پیاده‏‌سازی شده است. بیشترین  زمان پرس‏‌وجو مربوط به یافتن مرکز ثقل است و پیچیدگی مسائل فازی سربار زمانی بیشتری تحمیل نخواهد کرد. نتایج ارزیابی نشان می‌‏دهد که افزایش زمان پرس‏‌وجو با استفاده از رویکرد پیشنهادی مبتنی بر منطق فازی نسبت به زمان پرس‏‌وجو با زبان ‏Cypher، با در نظر گرفتن پیچیدگی بیشتر مفاهیم فازی قابل ‏قبول‏ است. در نتیجه، راهکار پیشنهادی گزینه‏‌ای مناسب برای بهره‏‌گیری پرس‏‌وجوهای مبهم درون پایگاه داده‏‌های بزرگ خواهد بود.

کلیدواژه‌ها


عنوان مقاله [English]

A new approach to perform fuzzy queries over NoSQL database databases

نویسندگان [English]

  • Zahra Ahmadi
  • Farzam Matinfar
  • Fereshteh Azadi Parand
چکیده [English]

Today, due to massive amount of information, NoSQL databases are used to compute complex data. These databases are used to store semi-structured and unstructured data for big data management. In this paper, fuzzy queries are executed by users on the information stored in the Neo4j graph database, which show results in defuzzy manner. To evaluate the efficiency of the proposed method, we considered a database of manufacturing company. Price and quality fuzzy variables were considered and used to define and execute the fuzzy queries. The results can verify the performance of the proposed method. Additionally, a counselor (who has information about the data) defines fuzzy terms, membership functions, and fuzzy rules table. The most important process in this method is to find the center of gravity in order to defuzzify the final result. So, an algorithm has been implemented for this purpose by C # programming language. The greatest query time is due to find center of gravity. The evaluation results show that the increase in query time by using the proposed approach in comparison to query time by using Cypher language is acceptable due to the complexity of fuzzy concepts. Therefore, the proposed solution will be suitable for using ambiguous and fuzzy queries in large databases.

کلیدواژه‌ها [English]

  • NoSQL
  • Neo4j Graph Database
  • Fuzzy Query
  • Defuzzification
  • Center of Gravity