Christian Jan{\ss}en, Cedric Richter, Heike Wehrheim
개요
본 논문은 대규모 언어 모델(LLM)인 ChatGPT가 루프 불변식을 생성하여 형식적 소프트웨어 검증을 지원할 수 있는지 연구한다. 106개의 C 프로그램에 대한 루프 불변식을 생성하도록 ChatGPT를 활용하고, 생성된 불변식의 유효성과 유용성을 Frama-C와 CPAchecker를 통해 검증한다. 결과적으로 ChatGPT가 유효하고 유용한 불변식을 생성하여 Frama-C가 이전에 해결하지 못했던 작업을 검증할 수 있음을 보여준다.
시사점, 한계점
•
시사점:
◦
ChatGPT를 포함한 LLM이 형식적 소프트웨어 검증에 기여할 수 있는 가능성을 제시한다.