Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

FuzzAug: Data Augmentation by Coverage-guided Fuzzing for Neural Test Generation

Created by
  • Haebom

作者

Yifeng He, Jicheng Wang, Yuyang Rong, Hao Chen

概要

本論文は、信頼できるソフトウェア開発に不可欠なソフトウェアテストにおいて、手動でテストケースを生成する高コストを考慮し、大規模な言語モデルを活用した自動化されたテストケース生成方法が注目されていることを背景としています。従来のファジングなどの自動テスト方法よりもメンテナンスが容易な意味のあるテストを生成するニューラルネットワークアプローチについて説明します。しかし、既存のデータセットは、特に最新の言語の単位テストの多様性と量が限られているという問題を指摘しています。この論文では、ファジングの利点を大規模言語モデルに導入し、有効なテストセマンティクスを導入し、さまざまな適用範囲を持つ入力を提供する新しいデータ拡張技術であるFuzzAugを紹介します。 FuzzAugは、トレーニングデータセットのサイズを2倍に増やし、従来の方法よりもパフォーマンスを大幅に向上させ、動的ソフトウェア分析の事前知識をニューラルネットワークテスト生成に導入してパフォーマンスを向上させる可能性を示しています。

Takeaways、Limitations

Takeaways:
ファジング技術を活用した新しいデータ拡張技術FuzzAug提示により,大規模言語モデルベースのニューラルネットワークテスト生成性能の向上の可能性を提示
動的ソフトウェア分析の事前知識を活用してニューラルネットワークテスト生成の定性的向上の可能性を示す
既存のデータセットの限界を克服し、より多様で多くのユニットテストを生成する可能性を提示します。
Limitations:
FuzzAugのパフォーマンス向上が特定の言語または特定の種類のソフトウェアに限定される可能性。
FuzzAugの一般化性能と様々なソフトウェアシステムへの適用性に関するさらなる研究が必要
ファジング技術との統合の過程で発生する可能性がある追加のコストまたは複雑さを考慮する必要性。
👍