ارائه مدل توصیه‌گر برای بهبود عملکرد بلاکچین در اینترنت اشیاء با رویکرد یادگیری تقویتی عمیق

نویسندگان

دانشگاه صنعتی خواجه نصیرالدین طوسی؛ تهران؛ ایران.

چکیده

با پیشرفت جامعه بشری و فناوری اطلاعات و ارتباطات، اینترنت اشیا در ابعاد مختلف زندگی روزمره مردم و صنایع نفوذ کرده است. اینترنت اشیا با وجود تمامی تسهیلات، به‌دلیل ساختار ضعیف امنیتی تبدیل به یکی از اهداف هکرها شده است. فناوری نوظهور بلاکچین با توجه به ویژگی‌های ذاتی از قبیل توزیع‌شدگی، امنیت، تغییرناپذیری و قابل بررسی بودن تبدیل به راه‌‌حلی مناسب برای تأمین امنیت اینترنت اشیا شده ‌است. با وجود این، ادغام اینترنت اشیا و بلاکچین دارای چالش‌هایی مانند تأخیر، گذردهی، مقیاس‌پذیری و محدودیت توان دستگاه است. روش‌های یادگیری ماشین در حل مسائل پیچیده که برای انسان دشوار است، کارایی مناسبی از خود نشان داده و به‌ همین دلیل، به‌تازگی به‌عنوان یکی از راه‌های حل چالش‌های بلاکچین در اینترنت اشیا مطرح شده‌اند. در این پژوهش برای بهبود چالش‌های بلاکچین در اینترنت اشیا یک مدل جدید مبتنی بر عامل توصیه‌گر ارائه داده‌ایم. هدف این مدل بهبود چالش گذردهی پایین بلاکچین در اینترنت اشیا و محدودیت منابع دستگاه‌های اینترنت اشیا برای استفاده از بلاکچین است. برای بهبود گذردهی عامل توصیه‌گر که از یادگیری تقویتی عمیق استفاده می‌کند، بلاک با تنظیم اندازه و زمانِ ساخت می‌تواند گذردهی را بهبود بخشد. همچنین، عامل توصیه‌گر با دریافت توان محاسباتی دستگاه اینترنت اشیا و میزان انرژی مورد نیاز برای فرایند استخراج، رویکرد بهینه را از بین انجام فرایند استخراج در دستگاه اینترنت اشیا و یا واگذاری به لایه لبه محاسباتی انتخاب می‌کند. رویکرد بهینه در این پژوهش رویکردی است که میزان تأخیر و انرژی مصرفی فرایند استخراج را کمینه سازد. در این پژوهش افزون بر ارائه معماری منطقی، به گردش کار عناصر مدل پیشنهادی نیز با جزئیات پرداخته شده‌ است. طراحی مدل پییشنهادی با استفاده از روش اصل واحد برای حل چالش‌های بلاکچین در اینترنت اشیا مورد بررسی قرار گرفته و نقاط ضعف و قوت مدل بیان شده ‌است.

کلیدواژه‌ها


عنوان مقاله [English]

Provision of a recommender model for performance improvements for blockchain in the Internet of Things with a deep reinforcement learning approach

نویسندگان [English]

  • Elnaz Rabieinejad,
  • Shahriar Mohammadi
  • Mahdi Yadegari
چکیده [English]

With the advancement of human society and information and communication technology, the Internet of Things has penetrated into various aspects of the daily lives of people and industries. Emerging blockchain technology has become a viable solution to IoT security due to its inherent characteristics such as distribution, security, immutability, and traceability. However, the integration of IoT and blockchain has challenges such as latency, throughput, scalability, and device power limitation. Recent research has focused on the role of artificial intelligence methods in improving IoT performance in blockchain. According to the studies, there are few effects on improving the performance of IoT devices with limited power, so in this study, a conceptual model for improving blockchain performance in IoT devices with limited power by deep reinforcement learning is proposed. In this model, Internet devices with limited power can delegate their extraction task to the mobile edge computing layer. The presented model has six layers of perception, data, network, consensus, mobile edge computing and application which are explained in detail. In this model, to improve the throughput and select the mining method, a recommender located in the mobile edge computation layer is used. Recommender systems are adjusted by adjusting the size and time of building blocks to improve the throughput and also tries to minimize the delay and energy consumption of the mining operation by selecting suitable method. To achieve good performance in reinforcement learning, the use of Q learning and long-short term memory is suggested. The use of deep reinforcement learning is to set the block size by considering the transmission delay in order to increase throughput as well as mining with respect to the minimum delays, and energy consumption in the proposed conceptual model can improve the performance of blockchain in the IoT.

کلیدواژه‌ها [English]

  • Blockchain
  • internet of things
  • Reinforcement Learning
  • Q Learning
  • Long–Short Term Memory