Cet article part du constat que les méthodes de génération automatisée de cas de test utilisant des modèles de langage à grande échelle suscitent un intérêt croissant, compte tenu du coût élevé de la génération manuelle de cas de test dans les tests logiciels, pourtant essentielle à un développement logiciel fiable. Nous présentons une approche par réseau neuronal qui génère des tests pertinents et plus faciles à maintenir que les méthodes de test automatisées existantes, telles que le fuzzing. Cependant, les ensembles de données existants soulignent le problème de la variété et de la quantité limitées des tests unitaires, notamment pour les langages modernes. Dans cet article, nous présentons FuzzAug, une nouvelle technique d'augmentation des données qui introduit les avantages du fuzzing dans les modèles de langage à grande échelle afin d'introduire une sémantique de test valide et de fournir des données d'entrée aux champs d'application variés. FuzzAug améliore significativement les performances par rapport aux méthodes existantes en doublant la taille de l'ensemble de données d'apprentissage, et démontre la possibilité d'améliorer les performances en intégrant les connaissances préalables issues de l'analyse logicielle dynamique à la génération de tests par réseau neuronal.