Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Knowledge Graph Based Repository-Level Code Generation

Created by
  • Haebom

저자

Mihir Athale, Vishal Vaddina

개요

본 논문은 대규모 언어 모델(LLM)을 이용한 코드 생성에서의 한계점, 특히 진화하는 코드베이스 내에서의 문맥 정확성 문제를 해결하기 위해 지식 그래프 기반 접근법을 제시합니다. 기존 코드 검색 및 검색 방법의 취약점을 보완하여, 코드 저장소를 그래프로 표현하여 구조적 및 관계적 정보를 포착함으로써 문맥 인식 코드 생성을 향상시킵니다. 하이브리드 접근 방식을 통해 코드 검색의 문맥적 관련성을 높이고, 파일 간 모듈 의존성을 추적하여 더욱 강력하고 기존 코드베이스와 일관성 있는 코드 생성을 가능하게 합니다. Evolutionary Code Benchmark (EvoCodeBench) 데이터셋을 사용한 실험 결과, 제안된 방법이 기존 방식보다 성능이 뛰어남을 보여줍니다.

시사점, 한계점

시사점:
지식 그래프 기반 접근법을 통해 LLM 기반 코드 생성의 문맥 정확성을 향상시킬 수 있음을 보여줌.
코드 저장소의 구조적, 관계적 정보를 활용하여 더욱 강력하고 일관성 있는 코드 생성이 가능함을 제시.
하이브리드 코드 검색 방식을 통해 문맥적으로 더욱 관련성 높은 코드 검색 및 검색 결과를 제공.
EvoCodeBench 데이터셋을 사용한 실험 결과를 통해 제안된 방법의 우수성을 검증.
향상된 문맥 인식 코드 생성 도구 개발에 기여할 수 있는 가능성 제시.
한계점:
EvoCodeBench 데이터셋에 대한 의존성. 다른 데이터셋으로의 일반화 가능성에 대한 추가 연구 필요.
제안된 방법의 확장성 및 복잡성에 대한 추가적인 분석 필요.
실제 대규모 코드베이스에서의 성능 평가가 부족.
다양한 프로그래밍 언어 및 코드 스타일 지원에 대한 추가적인 연구 필요.
👍