본 논문은 신뢰할 수 있는 소프트웨어 개발에 필수적인 소프트웨어 테스트에서, 수동으로 테스트 케이스를 생성하는 높은 비용을 고려하여 대규모 언어 모델을 활용한 자동화된 테스트 케이스 생성 방법이 주목받고 있음을 배경으로 합니다. 기존의 퍼징과 같은 자동 테스트 방법보다 유지보수가 용이한 의미있는 테스트를 생성하는 신경망 접근 방식에 대해 논의합니다. 하지만 기존 데이터셋은 특히 최신 언어에 대한 단위 테스트의 다양성과 양이 제한적이라는 문제점을 지적합니다. 이에 본 논문에서는 퍼징의 장점을 대규모 언어 모델에 도입하여 유효한 테스트 의미를 도입하고 다양한 적용범위를 가진 입력을 제공하는 새로운 데이터 증강 기법인 FuzzAug를 제시합니다. FuzzAug는 훈련 데이터셋의 크기를 두 배로 늘려 기존 방식보다 성능을 크게 향상시키며, 동적 소프트웨어 분석의 사전 지식을 신경망 테스트 생성에 도입하여 성능을 향상시킬 수 있는 가능성을 보여줍니다.