Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Bandidos multiarmados con presupuesto adaptable para IoT con restricciones dinámicas de recursos

Created by
  • Haebom

Autor

Shubham Vaishnav, Praveen Kumar Donta, Sindri Magnusson

Describir

Este artículo se centra en los sistemas del Internet de las Cosas (IoT), que deben responder en tiempo real a la vez que gestionan restricciones de recursos fluctuantes, como la energía y el ancho de banda. Observamos que los métodos existentes tienen dificultades para gestionar restricciones operativas que cambian con el tiempo, y proponemos un nuevo marco de Bandido Multiarmado Presupuestado (Bandit Multi-Armado) adaptado a aplicaciones del IoT con límites operativos dinámicos. Este modelo introduce un presupuesto de violación decreciente, que permite de forma restrictiva violaciones de restricciones en las primeras etapas del aprendizaje y aplica gradualmente un cumplimiento más estricto con el tiempo. Presentamos el algoritmo de Límite Superior de Confianza Presupuestado (UCB), que equilibra adaptativamente la optimización del rendimiento y el cumplimiento de restricciones variables en el tiempo, y ofrecemos garantías teóricas de que el UCB presupuestado logra un arrepentimiento sublineal y violaciones de restricciones logarítmicas durante el periodo de aprendizaje. Simulaciones exhaustivas en un entorno de comunicación inalámbrica demuestran que el método propuesto logra una adaptación más rápida y un mejor cumplimiento de las restricciones que los métodos de aprendizaje en línea estándar, lo que destaca el potencial del marco para construir sistemas del IoT adaptativos y con capacidad de adaptación a los recursos.

Takeaways, Limitations

Takeaways:
Un nuevo marco de aprendizaje para sistemas IoT con restricciones variables en el tiempo
Lograr efectivamente un equilibrio entre la optimización del rendimiento y el cumplimiento de las restricciones a través del algoritmo UCB presupuestado.
Garantizar el rendimiento del algoritmo mediante análisis teórico
Verificación de un rendimiento superior en comparación con los métodos existentes mediante simulación de comunicación inalámbrica
Contribuyendo al diseño de sistemas IoT adaptativos y eficientes en el uso de recursos
Limitations:
Se necesita más investigación para evaluar la aplicación del marco propuesto a entornos de IoT del mundo real y su rendimiento.
Es necesario verificar la generalización para varios tipos de restricciones y sistemas de IoT complejos.
Se necesita investigación para determinar los parámetros óptimos para un presupuesto decreciente de violaciones.
Es necesaria una evaluación de la robustez frente al ruido y la incertidumbre en entornos del mundo real.
👍