Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Explorando la integración de grandes modelos de lenguaje en procesos de mantenimiento de pruebas industriales

Created by
  • Haebom

Autor

Jingxiong Liu, Ludvig Lemner, Linnea Wahlgren, Gregory Gay, Nasser Mohammadiha, Joakim Wennerberg

Describir

Este artículo explora el soporte automatizado para el mantenimiento de pruebas (añadir, eliminar o modificar casos de prueba), una tarea costosa y laboriosa en el proceso de pruebas de software. En particular, investigamos cómo facilitar el mantenimiento de pruebas mediante el uso de modelos de lenguaje a gran escala (LLM) a través de un caso práctico en Ericsson AB. Analizamos los LLM para predecir cuándo se requiere el mantenimiento de pruebas, qué tareas puede realizar y qué considerar al implementarlos en un entorno industrial. Además, proponemos y demostramos una arquitectura multiagente que predice qué pruebas requerirán mantenimiento tras cambios en el código fuente. En conclusión, este estudio mejora la comprensión teórica y práctica de cómo aplicar los LLM a los procesos de mantenimiento de pruebas en entornos industriales.

Takeaways, Limitations

Takeaways:
Presenta la posibilidad de reducir el costo y mejorar la calidad del mantenimiento de pruebas de software mediante la utilización de LLM.
Presenta consideraciones prácticas para la aplicación del LLM en un entorno industrial.
Proponemos una arquitectura multiagente que predice qué pruebas requieren mantenimiento después de cambios en el código fuente.
Limitations:
Dado que se trata de un estudio de caso dirigido a Ericsson AB, la generalización a otros entornos o sistemas industriales puede ser limitada.
Es necesaria una evaluación más profunda del rendimiento y la escalabilidad de la arquitectura multiagente propuesta.
Se necesita una mayor validación de la precisión y confiabilidad del LLM.
👍