Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Vector Graph-Based Repository Understanding for Issue-Driven File Retrieval

Created by
  • Haebom

저자

Kostiantyn Bevziuk, Andrii Fatula, Svetozar Lashin Yaroslav Opanasenko, Anna Tukhtarova, Ashok Jallepalli Pradeepkumar Sharma, Hritvik Shrivastava

개요

본 논문은 대규모 소프트웨어 저장소를 프로젝트의 아키텍처 및 의미 구조를 반영하는 벡터화된 지식 그래프로 변환하는 저장소 분해 시스템을 제시합니다. 이 그래프는 포함, 구현, 참조, 호출, 상속과 같은 구문 관계를 인코딩하고, LLM(Large Language Model)에서 파생된 요약 및 벡터 임베딩으로 노드를 보강합니다. 하이브리드 검색 파이프라인은 의미 검색과 그래프 인식 확장을 결합하고, LLM 기반 어시스턴트는 제한된 읽기 전용 그래프 요청을 공식화하고 인간 지향적인 설명을 생성합니다.

시사점, 한계점

시사점:
프로젝트 아키텍처 및 의미 구조를 이해하고 활용하여 저장소 개발 자동화 가능성을 제시함.
LLM을 활용하여 노드에 풍부한 정보를 추가하고, 사용자 친화적인 설명을 제공.
하이브리드 검색 파이프라인을 통해 효율적인 정보 검색 및 그래프 탐색 가능.
한계점:
논문에서 구체적인 성능 평가 및 실제 적용 사례에 대한 자세한 설명 부족.
LLM 의존성으로 인한 모델 편향 및 설명의 정확성 문제 가능성.
대규모 저장소 처리 시 계산 복잡성 및 확장성 문제 발생 가능성.
👍