Este artículo se basa en el contexto de que los métodos automatizados de generación de casos de prueba que utilizan modelos de lenguaje a gran escala están cobrando cada vez más importancia, considerando el alto coste de la generación manual de casos de prueba en las pruebas de software, esencial para un desarrollo de software fiable. Analizamos un enfoque basado en redes neuronales que genera pruebas significativas y más fáciles de mantener que los métodos de prueba automatizados existentes, como el fuzzing. Sin embargo, los conjuntos de datos existentes señalan el problema de que la variedad y cantidad de pruebas unitarias, especialmente para lenguajes modernos, son limitadas. En este artículo, presentamos FuzzAug, una nueva técnica de aumento de datos que incorpora las ventajas del fuzzing en modelos de lenguaje a gran escala para introducir semántica de prueba válida y proporcionar entradas con diversos ámbitos de aplicación. FuzzAug mejora significativamente el rendimiento con respecto a los métodos existentes al duplicar el tamaño del conjunto de datos de entrenamiento y muestra la posibilidad de mejorar el rendimiento mediante la introducción de conocimiento previo del análisis dinámico de software en la generación de pruebas de redes neuronales.