Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

FuzzAug : Augmentation des données par fuzzing guidé par la couverture pour la génération de tests neuronaux

Created by
  • Haebom

Auteur

Yifeng He, Jicheng Wang, Yuyang Rong, Hao Chen

Contour

Cet article part du constat que les méthodes de génération automatisée de cas de test utilisant des modèles de langage à grande échelle suscitent un intérêt croissant, compte tenu du coût élevé de la génération manuelle de cas de test dans les tests logiciels, pourtant essentielle à un développement logiciel fiable. Nous présentons une approche par réseau neuronal qui génère des tests pertinents et plus faciles à maintenir que les méthodes de test automatisées existantes, telles que le fuzzing. Cependant, les ensembles de données existants soulignent le problème de la variété et de la quantité limitées des tests unitaires, notamment pour les langages modernes. Dans cet article, nous présentons FuzzAug, une nouvelle technique d'augmentation des données qui introduit les avantages du fuzzing dans les modèles de langage à grande échelle afin d'introduire une sémantique de test valide et de fournir des données d'entrée aux champs d'application variés. FuzzAug améliore significativement les performances par rapport aux méthodes existantes en doublant la taille de l'ensemble de données d'apprentissage, et démontre la possibilité d'améliorer les performances en intégrant les connaissances préalables issues de l'analyse logicielle dynamique à la génération de tests par réseau neuronal.

Takeaways, Limitations_

Takeaways:
Nous proposons une nouvelle technique d'augmentation de données appelée FuzzAug qui utilise des techniques de fuzzing pour suggérer la possibilité d'améliorer les performances de génération de tests de réseaux neuronaux basés sur des modèles linguistiques à grande échelle.
Nous démontrons le potentiel d’amélioration qualitative de la génération de tests de réseaux neuronaux en exploitant les connaissances préalables issues de l’analyse logicielle dynamique.
Surmonter les limites des ensembles de données existants et suggérer la possibilité de générer des tests unitaires plus diversifiés et plus nombreux.
Limitations:
Les améliorations de performances de FuzzAug peuvent être limitées à certains langages ou types de logiciels.
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de FuzzAug et son applicabilité à divers systèmes logiciels.
Il convient de prendre en compte les coûts supplémentaires ou les complexités qui peuvent découler de l’intégration avec les techniques de fuzzing.
👍