Cet article examine en détail l'intersection entre l'intelligence distribuée et l'optimisation des modèles dans le cadre du calcul collaboratif Edge-Cloud (ECCC). ECCC est un paradigme fondamental qui intègre les ressources cloud et les périphériques périphériques pour répondre aux exigences de calcul des applications intelligentes modernes. Il propose un tutoriel systématique sur l'architecture sous-jacente, les technologies clés et les applications émergentes. Il analyse les approches d'optimisation des modèles, telles que la compression, l'adaptation et la recherche d'architecture neuronale, ainsi que les stratégies de gestion des ressources basées sur l'IA qui équilibrent les exigences de performance, d'efficacité énergétique et de latence. De plus, il explore les aspects critiques de l'amélioration de la confidentialité et de la sécurité au sein des systèmes ECCC et examine les déploiements réels dans diverses applications de la conduite autonome, de la santé et de l'automatisation industrielle. Grâce à des techniques d'analyse des performances et d'analyse comparative, il établit des normes d'évaluation pour ces systèmes complexes. Il suggère également d'importantes orientations de recherche, notamment le déploiement de LLM, l'intégration de la 6G, le calcul neuromorphique et l'informatique quantique, et fournit une feuille de route pour la gestion de l'hétérogénéité, le traitement temps réel et l'évolutivité.