LeanRAG: Knowledge-Graph-Based Generation with Semantic Aggregation and Hierarchical Retrieval
Created by
Haebom
Category
Empty
저자
Yaoze Zhang, Rong Wu, Pinlong Cai, Xiaoman Wang, Guohang Yan, Song Mao, Ding Wang, Botian Shi
개요
LeanRAG는 외부 지식을 활용하여 대형 언어 모델(LLM)을 향상시키는 검색 증강 생성(RAG) 프레임워크입니다. 이 프레임워크는 지식 그래프를 기반으로 하며, '단절된 의미론적 섬' 문제를 해결하기 위해 엔티티 클러스터를 형성하고 집계 수준 요약 간의 명시적 관계를 구축하는 새로운 의미론적 집계 알고리즘을 사용합니다. 또한, 그래프의 토폴로지를 활용하여 쿼리를 관련 세분화된 엔티티에 고정하고 의미론적 경로를 체계적으로 탐색하는 하향식 구조 안내 검색 전략을 도입하여 중복 정보 검색을 최소화합니다. 네 가지 까다로운 QA 벤치마크에서 기존 방법보다 응답 품질이 우수하고 검색 중복성을 46% 줄이는 성능을 보였습니다.
시사점, 한계점
•
시사점:
◦
지식 그래프 기반 RAG에서 '단절된 의미론적 섬' 문제를 해결하여, 집계된 요약 간의 명시적 관계를 구축함으로써 교차 커뮤니티 추론을 가능하게 함.
◦
구조화된 검색 전략을 통해 그래프의 토폴로지를 활용하여 비효율적인 평면 검색 문제를 개선하고, 중복 정보 검색을 최소화함.