Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation

Created by
  • Haebom

저자

Jane Luo, Xin Zhang, Steven Liu, Jie Wu, Yiming Huang, Yangyu Huang, Chengyu Yin, Ying Xin, Jianfeng Liu, Yuefeng Zhan, Hao Sun, Qi Chen, Scarlett Li, Mao Yang

Repository Planning Graph (RPG)를 활용한 완전한 코드 저장소 생성

개요

대규모 언어 모델(LLM)은 개별 함수나 단일 코드 파일 생성에 능숙하지만, 처음부터 완전한 코드 저장소를 생성하는 데에는 어려움이 있다. 본 논문은 고수준 명세로부터 일관된 소프트웨어 시스템을 구축하고 자동 코드 생성의 잠재력을 최대한 실현하기 위한 핵심 과제인 완전한 저장소 생성을 다룬다. 이를 위해, 특징과 모듈을 결정하는 (제안 단계) 및 구현 세부 정보를 정의하는 (구현 단계) 두 단계의 계획이 필요하며, 기존 자연어 기반의 접근 방식이 모호함과 구조 부족으로 인해 명세 불분명, 구성 요소 불일치, 설계 취약성 등의 문제를 야기한다는 점을 지적한다. 이러한 한계를 극복하고자, 기능, 파일 구조, 데이터 흐름, 함수를 통합 그래프로 인코딩하는 구조화된 표현인 Repository Planning Graph (RPG)를 제안한다. RPG는 명시적인 청사진을 통해 저장소 생성을 위한 일관된 장기 계획을 가능하게 한다. RPG를 기반으로, 제안 수준 계획, 구현 수준 구성, 테스트 검증을 통한 그래프 기반 코드 생성을 수행하는 ZeroRepo 프레임워크를 개발했다. 6개의 실제 프로젝트, 1,052개 작업으로 구성된 RepoCraft 벤치마크를 통해 ZeroRepo를 평가한 결과, ZeroRepo는 36,000줄의 코드와 445,000개의 코드 토큰을 생성하여, 기존 최고 성능 모델(Claude Code)보다 평균 3.9배, 다른 기준선보다 68배 더 많은 양을 생성했다. 또한 81.5%의 적용 범위와 69.7%의 테스트 정확도를 달성하여 Claude Code보다 각각 27.3점, 35.8점 향상된 성능을 보였다. 추가 분석을 통해 RPG가 복잡한 종속성을 모델링하고, 거의 선형적으로 확장되는 보다 정교한 계획을 가능하게 하며, 에이전트의 저장소 이해도를 향상시켜 지역화를 가속화한다는 것을 확인했다.

시사점, 한계점

시사점:
RPG를 활용한 ZeroRepo 프레임워크는 완전한 코드 저장소 생성에 성공적인 결과를 보임.
구조화된 RPG 표현을 통해 코드 생성의 일관성을 향상시킴.
기존 방법론 대비 대폭 향상된 성능을 RepoCraft 벤치마크를 통해 입증.
복잡한 종속성 모델링, 정교한 계획 수립, 에이전트 이해도 향상 가능성 제시.
한계점:
논문에서 구체적인 한계점은 직접적으로 언급되지 않음.
RepoCraft 벤치마크 외 다른 벤치마크에 대한 일반화 가능성은 추가적인 연구가 필요함.
모델의 복잡성과 계산 비용에 대한 명시적인 언급은 없음.
👍