Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

LocAgent: Graph-Guided LLM Agents for Code Localization

Created by
  • Haebom
Category
Empty

저자

Zhaoling Chen, Xiangru Tang, Gangda Deng, Fang Wu, Jialong Wu, Zhiwei Jiang, Viktor Prasanna, Arman Cohan, Xingyao Wang

개요

LocAgent는 소프트웨어 유지보수에서 코드 위치 확인 문제를 해결하기 위해 그래프 기반 표현을 사용하는 프레임워크입니다. 코드베이스를 방향성 비균질 그래프로 파싱하여 코드 구조(파일, 클래스, 함수)와 종속성(import, 호출, 상속)을 가볍게 표현합니다. 이를 통해 LLM 에이전트가 다단계 추론을 통해 관련 엔티티를 효과적으로 검색하고 위치를 파악할 수 있습니다. 실제 벤치마크 결과, LocAgent는 코드 위치 확인 정확도를 크게 향상시키며, 특히 미세 조정된 Qwen-2.5-Coder-Instruct-32B 모델을 사용했을 때 기존 최고 성능의 독점 모델과 비슷한 결과를 훨씬 낮은 비용(약 86% 감소)으로 달성했습니다. 파일 단위 위치 확인에서 최대 92.7%의 정확도를 달성했고, GitHub 이슈 해결 성공률을 여러 번 시도 시 12% 향상시켰습니다 (Pass@10). 코드는 https://github.com/gersteinlab/LocAgent 에서 이용 가능합니다.

시사점, 한계점

시사점:
그래프 기반 표현을 통해 LLM을 이용한 효율적인 코드 위치 확인 가능.
기존 최고 성능 모델과 비슷한 정확도를 훨씬 낮은 비용으로 달성.
GitHub 이슈 해결 성공률 향상.
오픈소스로 공개되어 접근성이 높음.
한계점:
특정 LLM 모델(Qwen-2.5-Coder-Instruct-32B)에 대한 의존성. 다른 LLM 모델의 성능은 검증되지 않았음.
실험 데이터셋의 한계. 다양한 종류의 코드베이스와 문제에 대한 일반화 성능은 추가적인 연구가 필요함.
그래프 생성 및 처리 과정의 효율성 개선 필요성. 대규모 코드베이스에 대한 확장성 평가 필요.
👍