Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation

Created by
  • Haebom

저자

Jane Luo, Xin Zhang, Steven Liu, Jie Wu, Yiming Huang, Yangyu Huang, Chengyu Yin, Ying Xin, Jianfeng Liu, Yuefeng Zhan, Hao Sun, Qi Chen, Scarlett Li, Mao Yang

개요

본 논문은 처음부터 완전한 소프트웨어 저장소를 생성하는 과제를 해결하기 위해 Repository Planning Graph (RPG)라는 지속적인 표현 방식을 제안합니다. RPG는 제안 및 구현 단계의 계획을 통합하여 기능, 파일 구조, 데이터 흐름 및 함수를 하나의 그래프로 인코딩함으로써 모호한 자연어 대신 명시적인 청사진을 제공합니다. 이를 기반으로, 논문에서는 RPG를 활용하여 처음부터 저장소를 생성하는 그래프 기반 프레임워크인 ZeroRepo를 개발했습니다. ZeroRepo는 제안 단계 계획 및 구현 단계 개선을 통해 그래프를 구성하고, 그래프를 안내하여 코드를 생성하고 테스트를 통해 검증하는 세 단계로 작동합니다. RepoCraft라는 실제 프로젝트 6개로 구성된 벤치마크(1,052개 작업)를 사용하여 ZeroRepo를 평가한 결과, 평균 36,000줄의 코드를 생성하여 기존 최고 성능 기준(Claude Code) 대비 약 3.9배, 다른 기준 대비 약 64배의 성능을 보였습니다. 또한 81.5%의 기능 적용률과 69.7%의 통과율을 달성하여 Claude Code보다 각각 27.3%p, 35.8%p 높은 성능을 기록했습니다. 추가 분석을 통해 RPG는 복잡한 종속성을 모델링하고, 거의 선형적으로 확장 가능한 계획을 가능하게 하며, LLM의 저장소 이해도를 높여 에이전트의 위치 파악을 가속화한다는 것을 보여줍니다.

시사점, 한계점

시사점:
RPG를 이용한 저장소 생성을 위한 새로운 프레임워크 ZeroRepo 제시
기존 LLM 기반 코드 생성 모델 대비 월등히 향상된 성능 (코드 양, 기능 적용률, 통과율)
복잡한 소프트웨어 구조를 효과적으로 표현하고 계획하는 방법 제시
LLM의 저장소 이해도 향상 및 에이전트 위치 파악 가속화
한계점:
RepoCraft 벤치마크의 규모가 제한적일 수 있음.
실제 대규모 프로젝트 적용 시 성능 및 확장성에 대한 추가적인 검증 필요.
RPG의 복잡성이 일부 사용자에게는 진입 장벽이 될 수 있음.
다양한 프로그래밍 언어 및 개발 환경에 대한 적용성 평가 필요.
👍