Este artículo examina exhaustivamente la intersección de la inteligencia distribuida y la optimización de modelos en la Computación Colaborativa Edge-Cloud (ECCC). La ECCC, que integra dispositivos edge y recursos en la nube para permitir un procesamiento eficiente y de baja latencia, se ha consolidado como un paradigma clave para abordar las demandas computacionales de las aplicaciones inteligentes modernas. Este artículo ofrece un tutorial estructurado sobre la arquitectura subyacente, las tecnologías habilitadoras y las aplicaciones emergentes. Analiza sistemáticamente los métodos de optimización de modelos, como la compresión, la adaptación y la exploración de la arquitectura de redes neuronales, junto con estrategias de gestión de recursos basadas en IA que equilibran el rendimiento, la eficiencia energética y los requisitos de latencia. Además, explora aspectos críticos para mejorar la privacidad y la seguridad dentro de los sistemas ECCC y examina implementaciones reales en diversas aplicaciones, como la conducción autónoma, la atención médica y la automatización industrial. También se exploran en profundidad las técnicas de análisis de rendimiento y evaluación comparativa para establecer estándares de evaluación para estos sistemas complejos. Finalmente, presenta una hoja de ruta para abordar los desafíos actuales de la gestión de la heterogeneidad, el procesamiento en tiempo real y la escalabilidad, destacando las principales líneas de investigación, como la implementación de LLM, la integración de 6G, la computación neuromórfica y la computación cuántica.