Shu Wang, Yixiang Fang, Yingli Zhou, Xilin Liu, Yuchi Ma
개요
본 논문은 기존의 그래프 기반 RAG(Retrieval-Augmented Generation) 접근 방식의 한계점인 관련 정보 식별의 부정확성과 과도한 토큰 소모 문제를 해결하기 위해 새로운 접근 방식인 ArchRAG(Attributed Community-based Hierarchical RAG)를 제안합니다. ArchRAG는 속성 기반 커뮤니티를 이용하여 질문을 보강하고, LLM 기반 계층적 클러스터링 방법을 도입하여 그래프에서 가장 관련성 높은 정보를 효율적으로 검색합니다. 계층적 색인 구조를 구축하고 효과적인 온라인 검색 방법을 개발하여 정확도와 토큰 비용 측면에서 기존 방법들을 능가하는 성능을 보입니다. Huawei Cloud Computing의 도메인 지식 QA에 성공적으로 적용되었습니다.