대규모 언어 모델(LLM)을 사용하여 자연어 설명에서 최적화 모델을 생성하는 연구가 늘어나는 가운데, 생성된 모델의 정확성과 요구 사항 충족 여부를 검증하는 것이 중요해지고 있습니다. 본 연구에서는 최적화 모델 검증을 위해 소프트웨어 테스팅 기법을 기반으로 하는 에이전트 기반 자동 검증 방법을 제안합니다. 이 방법은 문제 수준의 테스팅 API 생성, API를 활용한 테스트 생성, 최적화 모델 특정 변이 생성 등의 과정을 거칩니다. 실험을 통해 이 에이전트 앙상블이 변이 커버리지(mutation coverage)라는 소프트웨어 테스팅 척도에서 높은 품질의 검증을 제공함을 확인했습니다.