Regresar a Artículos Indexados
  • AD HOC NETWORKS// (VOL. 94)

    Volumen: 94, Numero: 1, Páginas: [14]p.

    DEEP REINFORCEMENT LEARNING MECHANISM FOR DYNAMIC ACCESS CONTROL IN WIRELESS NETWORKS HANDLING MMTC

    Abstract

    One important issue that needs to be addressed in order to provide effective massive deployments of IoT devices is access control. In 5G cellular networks, the Access Class Barring (ACB) method aims at increasing the total successful access probability by delaying randomly access requests. This mechanism can be controlled through the barring rate, which can be easily adapted in networks where Human-to-Human (H2H) communications are prevalent. However, in scenarios with massive deployments such as those found in IoT applications, it is not evident how this parameter should be set, and how it should adapt to dynamic traffic conditions. We propose a double deep reinforcement learning mechanism to adapt the barring rate of ACB under dynamic conditions. The algorithm is trained with simultaneous H2H and Machine-to-Machine (M2M) traffic, but we perform a separate performance evaluation for each type of traffic. The results show that our proposed mechanism is able to reach a successful access rate of 100 % for both H2H and M2M UEs and reduce the mean number of preamble transmissions while slightly affecting the mean access delay, even for scenarios with very high load. Also, its performance remains stable under the variation of different parameters


    Keywords


    access control, deep reinforcement learning, massive machine type communications, 5G, cellular networks


    Resumen

    Una cuestión importante que debe abordarse para proporcionar unaimplementaciones masivas de dispositivos IoT es el control de acceso. En las redes celulares 5G,el método Access Class Barring (ACB) tiene como objetivo aumentar el éxito totalprobabilidad de acceso al retrasar las solicitudes de acceso aleatorio. Este mecanismo puedeser controlado a través de la tasa de restricción, que se puede adaptar fácilmente en las redesdonde prevalecen las comunicaciones de persona a persona (H2H). Sin embargo, enescenarios con implementaciones masivas como las que se encuentran en las aplicaciones IoT,no es evidente cómo debe configurarse este parámetro, y cómo debe adaptarse acondiciones dinámicas de tráfico. Proponemos un doble aprendizaje de refuerzo profundomecanismo para adaptar la tasa de bloqueo de ACB en condiciones dinámicas.losel algoritmo se entrena con H2H y Machine-to-Machine (M2M) simultáneostráfico, pero realizamos una evaluación de rendimiento separada para cada tipo de tráfico.Los resultados muestran que nuestro mecanismo propuesto es capaz de alcanzar un éxitotasa de acceso del 100 % para los UE H2H y M2M y reducir el número mediode transmisiones de preámbulo mientras afecta levemente el retardo de acceso medio, inclusopara escenarios con carga muy alta. Además, su rendimiento se mantiene estable bajola variación de diferentes parámetros.


    Palabras Clave


    control de acceso, aprendizaje de refuerzo profundo, tipo de máquina masiva comunicaciones, 5G, redes celulares.





    Acceder