Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

FuzzAug: Aumento de datos mediante fuzzing guiado por cobertura para la generación de pruebas neuronales

Created by
  • Haebom

Autor

Yifeng He, Jicheng Wang, Yuyang Rong, Hao Chen

Describir

Este artículo se basa en el contexto de que los métodos automatizados de generación de casos de prueba que utilizan modelos de lenguaje a gran escala están cobrando cada vez más importancia, considerando el alto coste de la generación manual de casos de prueba en las pruebas de software, esencial para un desarrollo de software fiable. Analizamos un enfoque basado en redes neuronales que genera pruebas significativas y más fáciles de mantener que los métodos de prueba automatizados existentes, como el fuzzing. Sin embargo, los conjuntos de datos existentes señalan el problema de que la variedad y cantidad de pruebas unitarias, especialmente para lenguajes modernos, son limitadas. En este artículo, presentamos FuzzAug, una nueva técnica de aumento de datos que incorpora las ventajas del fuzzing en modelos de lenguaje a gran escala para introducir semántica de prueba válida y proporcionar entradas con diversos ámbitos de aplicación. FuzzAug mejora significativamente el rendimiento con respecto a los métodos existentes al duplicar el tamaño del conjunto de datos de entrenamiento y muestra la posibilidad de mejorar el rendimiento mediante la introducción de conocimiento previo del análisis dinámico de software en la generación de pruebas de redes neuronales.

Takeaways, Limitations

Takeaways:
Proponemos una nueva técnica de aumento de datos llamada FuzzAug que utiliza técnicas de fuzzing para sugerir la posibilidad de mejorar el rendimiento de la generación de pruebas de redes neuronales basadas en modelos de lenguaje a gran escala.
Demostramos el potencial para mejorar cualitativamente la generación de pruebas de redes neuronales aprovechando el conocimiento previo del análisis de software dinámico.
Superar las limitaciones de los conjuntos de datos existentes y sugerir la posibilidad de generar pruebas unitarias más diversas y numerosas.
Limitations:
Las mejoras de rendimiento de FuzzAug pueden estar limitadas a ciertos idiomas o tipos de software.
Se necesita más investigación sobre el rendimiento de generalización de FuzzAug y su aplicabilidad a varios sistemas de software.
Se debe tener en cuenta cualquier costo o complejidad adicional que pueda surgir de la integración con técnicas de fuzzing.
👍