Este artículo propone un método para integrar modelos de lenguaje a gran escala (LLM) y servicios inteligentes mediante un marco de agentes, aprovechando los amplios recursos computacionales de las redes 6G. Los agentes basados en LLM pueden planificar y actuar de forma autónoma para procesar diversos significados del entorno e intenciones del usuario mediante módulos auxiliares y un núcleo de planificación. Sin embargo, los recursos limitados de los dispositivos de red individuales dificultan significativamente el funcionamiento eficiente de los agentes basados en LLM, incluyendo la invocación compleja de herramientas. Por lo tanto, se necesita urgentemente una colaboración eficiente entre dispositivos a múltiples niveles. Para abordar este problema, este artículo propone un marco y una metodología para un sistema multiagente basado en LLM con colaboración terminal-borde de doble bucle en redes 6G. El bucle externo consiste en la colaboración iterativa entre un agente global y múltiples subagentes desplegados en servidores y terminales de borde, lo que mejora las capacidades de planificación mediante la descomposición de tareas y la distribución paralela de subtareas. El bucle interno consta de subagentes con roles dedicados que infieren, ejecutan y replanifican subtareas de forma recursiva. Se integra la generación de invocaciones de herramientas en paralelo mediante estrategias de descarga para mejorar la eficiencia. A través de estudios de casos sobre la gestión de la seguridad urbana habilitada para 6G, verificamos las capacidades mejoradas de planificación del trabajo y la eficiencia en la ejecución del trabajo, y analizamos exhaustivamente los desafíos abiertos y las direcciones futuras en las redes 6G para acelerar el advenimiento de la era 6G.