대규모 언어 모델(LLM)은 개별 함수나 단일 코드 파일 생성에 능숙하지만, 처음부터 완전한 코드 저장소를 생성하는 데에는 어려움이 있다. 본 논문은 고수준 명세로부터 일관된 소프트웨어 시스템을 구축하고 자동 코드 생성의 잠재력을 최대한 실현하기 위한 핵심 과제인 완전한 저장소 생성을 다룬다. 이를 위해, 특징과 모듈을 결정하는 (제안 단계) 및 구현 세부 정보를 정의하는 (구현 단계) 두 단계의 계획이 필요하며, 기존 자연어 기반의 접근 방식이 모호함과 구조 부족으로 인해 명세 불분명, 구성 요소 불일치, 설계 취약성 등의 문제를 야기한다는 점을 지적한다. 이러한 한계를 극복하고자, 기능, 파일 구조, 데이터 흐름, 함수를 통합 그래프로 인코딩하는 구조화된 표현인 Repository Planning Graph (RPG)를 제안한다. RPG는 명시적인 청사진을 통해 저장소 생성을 위한 일관된 장기 계획을 가능하게 한다. RPG를 기반으로, 제안 수준 계획, 구현 수준 구성, 테스트 검증을 통한 그래프 기반 코드 생성을 수행하는 ZeroRepo 프레임워크를 개발했다. 6개의 실제 프로젝트, 1,052개 작업으로 구성된 RepoCraft 벤치마크를 통해 ZeroRepo를 평가한 결과, ZeroRepo는 36,000줄의 코드와 445,000개의 코드 토큰을 생성하여, 기존 최고 성능 모델(Claude Code)보다 평균 3.9배, 다른 기준선보다 68배 더 많은 양을 생성했다. 또한 81.5%의 적용 범위와 69.7%의 테스트 정확도를 달성하여 Claude Code보다 각각 27.3점, 35.8점 향상된 성능을 보였다. 추가 분석을 통해 RPG가 복잡한 종속성을 모델링하고, 거의 선형적으로 확장되는 보다 정교한 계획을 가능하게 하며, 에이전트의 저장소 이해도를 향상시켜 지역화를 가속화한다는 것을 확인했다.