Este estudio presenta un enfoque innovador que aprovecha los modelos de lenguaje a gran escala (LLM) para mejorar la eficiencia de la interpretación de datos de ensayos no destructivos (END) para el mantenimiento y la seguridad de puentes. Demostramos la eficacia de los LLM en la interpretación de mapas de contorno de END utilizando varios LLM y proporcionando un análisis detallado del estado de los puentes. Específicamente, se utilizaron nueve LLM para interpretar cinco mapas de contorno de END y se evaluaron en términos de generación de descripciones de imágenes, identificación de defectos, recomendaciones prácticas y precisión. Los resultados muestran que cuatro LLM generan descripciones de imágenes detalladas y efectivas, mientras que ChatGPT-4 y Claude 3.5 Sonnet son más eficaces en la generación de descripciones generales completas. Este estudio sugiere que el análisis basado en LLM puede mejorar la eficiencia de los flujos de trabajo de inspección de puentes, manteniendo la precisión.