Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Bandits multi-armés à budget adaptatif pour l'IoT avec contraintes de ressources dynamiques

Created by
  • Haebom

Auteur

Shubham Vaishnav, Praveen Kumar Donta, Sindri Magnusson

Contour

Cet article se concentre sur les systèmes de l'Internet des objets (IoT), qui doivent réagir en temps réel tout en gérant des contraintes de ressources fluctuantes telles que l'énergie et la bande passante. Nous constatons que les méthodes existantes peinent à gérer les contraintes opérationnelles qui évoluent au fil du temps, et proposons un nouveau modèle de Bandit Multi-Armé Budgété, adapté aux applications IoT avec des limites opérationnelles dynamiques. Ce modèle introduit un budget de violation décroissant, qui autorise de manière restrictive les violations de contraintes dès les premières étapes de l'apprentissage et impose progressivement une conformité plus stricte au fil du temps. Nous présentons l'algorithme de Limite Supérieure de Confiance Budgétée (UCB), qui équilibre de manière adaptative l'optimisation des performances et la conformité aux contraintes variables dans le temps, et fournit des garanties théoriques que l'UCB Budgétée atteint des violations de contraintes à regret sous-linéaire et logarithmiques pendant la période d'apprentissage. Des simulations approfondies dans un environnement de communication sans fil démontrent que la méthode proposée permet une adaptation plus rapide et une meilleure satisfaction des contraintes que les méthodes d'apprentissage en ligne standard, soulignant le potentiel de ce modèle pour la construction de systèmes IoT adaptatifs et sensibles aux ressources.

Takeaways, Limitations

Takeaways:
Un nouveau cadre d'apprentissage pour les systèmes IoT avec des contraintes variables dans le temps
Atteindre efficacement un équilibre entre l'optimisation des performances et le respect des contraintes grâce à l'algorithme UCB budgétisé.
Assurer la performance des algorithmes grâce à l'analyse théorique
Vérification des performances supérieures par rapport aux méthodes existantes grâce à la simulation de communication sans fil
Contribuer à la conception de systèmes IoT adaptatifs et économes en ressources
Limitations:
Des recherches supplémentaires sont nécessaires pour évaluer l’application du cadre proposé aux environnements IoT réels et ses performances.
La généralisabilité doit être vérifiée pour différents types de contraintes et de systèmes IoT complexes.
Des recherches sont nécessaires pour déterminer les paramètres optimaux pour un budget de violation décroissant.
Une évaluation de la robustesse face au bruit et à l’incertitude dans les environnements réels est nécessaire.
👍