QAEA-DR: A Unified Text Augmentation Framework for Dense Retrieval
Created by
Haebom
Category
Empty
저자
Hongming Tan, Shaoxiong Zhan, Hai Lin, Hai-Tao Zheng, Wai Kin Chan
개요
본 논문은 밀집 검색에서 긴 텍스트를 밀집 벡터로 임베딩할 때 발생하는 정보 손실 문제와 낮은 품질의 텍스트로 인한 정확도 저하 문제를 해결하기 위해 새로운 텍스트 증강 프레임워크인 QAEA-DR을 제안합니다. QAEA-DR은 대규모 언어 모델(LLM)을 이용하여 질문-응답 쌍과 요소 기반 이벤트라는 두 가지 텍스트 표현을 생성하여 원본 텍스트를 보완합니다. LLM 프롬프팅에 점수 기반 평가 및 재생성 메커니즘을 도입하여 생성된 텍스트의 품질을 향상시키며, 임베딩이나 검색 방법론을 수정하지 않고도 효과적으로 문제를 해결합니다. 이론적 분석과 실험적 결과를 통해 QAEA-DR 모델이 밀집 검색 성능 향상에 긍정적인 영향을 미침을 보여줍니다.