Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

TERAG: Token-Efficient Graph-Based Retrieval-Augmented Generation

Created by
  • Haebom
Category
Empty

저자

Qiao Xiao, Hong Ting Tsang, Jiaxin Bai

개요

본 논문은 대규모 언어 모델(LLM)의 추론, 정확성 및 사실성을 향상시키기 위한 그래프 기반 검색 증강 생성(RAG) 방식의 연구를 다룹니다. 특히, 그래프 구성 시 LLM 토큰 사용의 높은 비용 문제를 해결하기 위해, 저렴한 비용으로 유익한 그래프를 구축하는 TERAG 프레임워크를 제안합니다. HippoRAG에서 영감을 받아 검색 단계에서 Personalized PageRank (PPR)을 통합하여, 널리 사용되는 그래프 기반 RAG 방법의 최소 80% 정확도를 달성하면서 출력 토큰의 3%-11%만 소비합니다. TERAG는 낮은 토큰 사용량과 효율적인 구축 파이프라인으로 인해 대규모 및 비용 민감한 배포 시나리오에 적합합니다.

시사점, 한계점

시사점:
LLM 기반 RAG 시스템의 비용 효율성을 크게 향상시킴.
그래프 기반 RAG 방식의 정확성을 유지하면서 토큰 사용량 최소화.
대규모 및 비용 제약적인 환경에서의 LLM 활용 가능성을 높임.
한계점:
구체적인 성능 비교 대상 및 실험 환경에 대한 정보 부족.
다른 RAG 방식과의 일반적인 성능 차이에 대한 추가적인 분석 필요.
제안된 방법의 확장성 및 다양한 데이터 유형에 대한 적용 가능성에 대한 추가 연구 필요.
👍