Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Informatique collaborative Edge-Cloud sur l'intelligence distribuée et l'optimisation des modèles : une enquête

Created by
  • Haebom

Auteur

Jing Liu, Yao Du, Kun Yang, Jiaqi Wu, Yan Wang, Xiping Hu, Zehua Wang, Yang Liu, Peng Sun, Azzedine Boukerche, Victor CM Leung

Contour

Cet article examine en détail l'intersection entre l'intelligence distribuée et l'optimisation des modèles dans le cadre du calcul collaboratif Edge-Cloud (ECCC). L'ECCC, qui intègre des périphériques et des ressources cloud pour permettre un traitement efficace et à faible latence, s'est imposé comme un paradigme clé pour répondre aux exigences de calcul des applications intelligentes modernes. Cet article propose un tutoriel structuré sur l'architecture sous-jacente, les technologies clés et les applications émergentes. Il analyse systématiquement les méthodes d'optimisation des modèles, telles que la compression, l'adaptation et l'exploration de l'architecture des réseaux neuronaux, ainsi que les stratégies de gestion des ressources basées sur l'IA qui équilibrent les exigences de performance, d'efficacité énergétique et de latence. De plus, il explore les aspects critiques de l'amélioration de la confidentialité et de la sécurité au sein des systèmes ECCC et examine les déploiements réels dans diverses applications, notamment la conduite autonome, la santé et l'automatisation industrielle. Les techniques d'analyse des performances et d'analyse comparative sont également explorées en profondeur afin d'établir des normes d'évaluation pour ces systèmes complexes. Enfin, il présente une feuille de route pour relever les défis actuels de la gestion de l'hétérogénéité, du traitement en temps réel et de l'évolutivité, en mettant en évidence les axes de recherche clés, notamment le déploiement des LLM, l'intégration de la 6G, l'informatique neuromorphique et l'informatique quantique.

Takeaways, Limitations

Takeaways:
Nous présentons un aperçu complet des dernières tendances en matière d’intelligence distribuée et d’optimisation des modèles dans le système ECCC.
Nous analysons systématiquement les techniques d’optimisation des modèles, les stratégies de gestion des ressources basées sur l’IA et les mesures d’amélioration de la confidentialité et de la sécurité.
Nous présentons des cas de déploiement réels et des techniques d’analyse des performances et d’analyse comparative dans diverses applications.
Il suggère des orientations de recherche futures telles que le déploiement du LLM, l'intégration de la 6G, l'informatique neuromorphique et l'informatique quantique.
Limitations:
ÉTant donné que l’article se présente sous la forme d’une enquête, il se concentre sur une analyse complète des études existantes plutôt que sur de nouveaux résultats de recherche.
Parce qu’il couvre un sujet vaste plutôt qu’une analyse approfondie d’une technologie ou d’une application spécifique, les détails peuvent manquer quelque peu.
Les sujets présentés comme orientations de recherche futures en sont encore aux premiers stades de la recherche, et leur mise en œuvre et leur application réelles peuvent prendre un temps considérable.
👍