Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Formación de haces y asignación de recursos para la minimización del retardo en sistemas OFDM asistidos por RIS

Created by
  • Haebom

Autor

Yu Ma, Xiao Li, Chongtao Guo, Le Liang, Michail Matthaiou, Shi Jin

Describir

Este artículo estudia el problema conjunto de formación de haz y asignación de recursos para minimizar el retardo promedio en un sistema de multiplexación por división de frecuencia ortogonal (OFDM) con soporte de superficie inteligente reconfigurable (RIS) de enlace descendente. Cada paquete de datos del usuario llega a la estación base (BS) de forma probabilística, y este problema de optimización secuencial es esencialmente un proceso de decisión de Markov (MDP), que se enmarca en el ámbito del aprendizaje por refuerzo. Para gestionar eficazmente el espacio de acción mixto y reducir la dimensionalidad del espacio de estados, se propone un método híbrido de aprendizaje por refuerzo profundo (DRL). Específicamente, se utiliza la optimización de política de proximidad (PPO)-Theta para optimizar el diseño de desplazamiento de fase de RIS, y PPO-N es responsable de las decisiones de asignación de subportadoras. Posteriormente, la formación de haz activa en la BS se deriva de las decisiones de desplazamiento de fase de RIS y asignación de subportadoras optimizadas conjuntamente. Para mitigar aún más el problema de la dimensionalidad asociado con la asignación de subportadoras, se introduce una estrategia multiagente para optimizar de forma más eficiente el índice de asignación de subportadoras. Además, para lograr una asignación de recursos más adaptativa y capturar con precisión la dinámica de la red, integramos en el espacio de estados factores clave estrechamente relacionados con el retardo promedio, como el número de paquetes en espera en el búfer y la llegada actual de paquetes. Además, introducimos un marco de aprendizaje por transferencia para mejorar la eficiencia del entrenamiento y acelerar la convergencia. Los resultados de la simulación muestran que el algoritmo propuesto reduce significativamente el retardo promedio, mejora la eficiencia de la asignación de recursos y logra una robustez y equidad del sistema superiores a las de los métodos de referencia.

Takeaways, Limitations

Takeaways:
Presentamos un algoritmo híbrido eficiente de formación de haces y asignación de recursos basado en DRL para minimizar el retraso promedio en sistemas OFDM habilitados para RIS.
Mejoramos la eficiencia y la velocidad de convergencia del algoritmo aprovechando estrategias de múltiples agentes y marcos de aprendizaje por transferencia.
El algoritmo propuesto muestra mejoras de rendimiento en comparación con los métodos existentes, incluido un retraso promedio reducido, una eficiencia mejorada en la asignación de recursos y una mayor solidez y equidad del sistema.
Limitations:
El rendimiento del algoritmo propuesto se basa en resultados de simulación y requiere verificación del rendimiento en un entorno real.
La alta complejidad del algoritmo puede dificultar su implementación en tiempo real.
Se necesitan más investigaciones para investigar la robustez del algoritmo en diversos entornos de canal y condiciones de tráfico.
👍