Este artículo propone GraphTrafficGPT, una arquitectura basada en grafos, para mejorar la eficiencia de los sistemas inteligentes de gestión de tráfico basados en modelos de lenguaje a gran escala (LLM). Los sistemas existentes basados en cadenas (p. ej., TrafficGPT) presentan limitaciones para su aplicación en entornos reales complejos debido a la ejecución secuencial de tareas, el alto uso de tokens y la baja escalabilidad. GraphTrafficGPT utiliza un grafo que representa las tareas y sus dependencias como nodos y aristas para permitir la ejecución paralela y la asignación dinámica de recursos. El núcleo es un agente cerebral que descompone las consultas del usuario, construye un grafo de dependencias optimizado y coordina una red de agentes expertos para la recuperación, el análisis, la visualización y la simulación de datos. Procesa eficientemente las tareas interdependientes mediante la gestión de tokens contextual y el procesamiento simultáneo de múltiples consultas. Los resultados experimentales muestran que GraphTrafficGPT reduce el consumo de tokens en un 50,2 %, el retardo de respuesta promedio en un 19 % y mejora la eficiencia de la ejecución simultánea de múltiples consultas hasta en un 23 % en comparación con TrafficGPT.