# You Don't Need Public Tests to Generate Correct Code

### 저자

Kaushitha Silva, Srinath Perera

### 💡 개요

본 연구는 기존 자율 코드 생성 방식이 인간이 만든 공개 테스트 케이스에 크게 의존하여 발생하는 병목 현상과 과신 문제를 해결하고자 합니다. 이를 위해 언어 모델이 자체적으로 유효한 테스트 입력을 생성하고 실행을 시뮬레이션하여 자기 수정하는 DryRUN 프레임워크를 제안합니다. DryRUN은 공개 테스트 없이도 최신 기술에 필적하는 성능을 달성하며, 출력 토큰 사용량도 줄이는 성과를 보였습니다.

### 🔑 시사점 및 한계

- 실제 개발 환경에서 공개 테스트 케이스 접근이 어려운 경우에 대한 현실적인 해결책을 제시합니다.

- 공개 테스트 케이스에 대한 과도한 의존성으로 인한 과신(overconfidence) 문제를 완화하고, 일반화 성능을 향상시킬 수 있습니다.

- DryRUN은 외부 신호 없이도 코드 생성 및 검증이 가능함을 보여주며, 이는 향후 코드 생성 모델의 발전 방향에 중요한 시사점을 제공합니다.

- 현재 제안된 DryRUN의 성능이 최첨단 방식과 "필적"하는 수준이므로, 모든 유형의 복잡한 문제에 대해 동일한 성능을 보장하는지에 대한 추가적인 검증이 필요합니다.

[PDF 보기](https://arxiv.org/pdf/2604.21598)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).