Multi-Head RAG: Solving Multi-Aspect Problems with LLMs
Created by
Haebom
저자
Maciej Besta, Ales Kubicek, Robert Gerstenberger, Marcin Chrapek, Roman Niggli, Patrik Okanovic, Yi Zhu, Patrick Iff, Michal Podstawski, Lucas Weitzendorf, Mingyuan Chi, Joanna Gajda, Piotr Nyczyk, Jurgen Muller, Hubert Niewiadomski, Torsten Hoefler
개요
본 논문은 다양한 측면을 포함하는 복잡한 질의에 대한 응답을 개선하기 위해 Multi-Head RAG (MRAG)라는 새로운 Retrieval Augmented Generation (RAG) 기법을 제시합니다. 기존 RAG는 서로 다른 내용의 여러 문서를 검색하는 복잡한 질의에 대한 처리 능력이 부족한데, MRAG는 Transformer의 멀티-헤드 어텐션 레이어의 활성화를 활용하여 다양한 측면의 문서를 검색하는 방식을 제안합니다. 각 어텐션 헤드가 데이터의 다른 측면을 포착한다는 점에 착안하여, 해당 활성화를 이용함으로써 다양한 측면을 나타내는 임베딩을 생성하고 복잡한 질의에 대한 검색 정확도를 향상시킵니다. 실험 결과, MRAG은 18개의 기존 RAG 기법들에 비해 최대 20%의 검색 성공률 향상을 보였으며, LLM 생성 성능 향상에도 기여함을 보여줍니다.
시사점, 한계점
•
시사점:
◦
Transformer의 멀티-헤드 어텐션 메커니즘을 활용하여 다양한 측면의 문서 검색이 가능한 새로운 RAG 기법(MRAG) 제시.