Sign In

Quality-Aware Translation Tagging in Multilingual RAG system

Created by
  • Haebom
Category
Empty

저자

Hoyeon Moon, Byeolhee Kim, Nikhil Verma

개요

mRAG(Multilingual Retrieval-Augmented Generation)에서 낮은 품질의 번역이 생성 성능을 저하시키는 문제를 해결하기 위해, 원본 내용을 변경하지 않고 세 가지 차원(의미적 동등성, 문법적 정확성, 자연스러움 및 유창성)에서 번역 품질을 평가하여 메타데이터로 첨부하는 QTT-RAG(Quality-Aware Translation Tagging in mRAG)를 제안합니다. QTT-RAG는 두 개의 개방형 도메인 QA 벤치마크(XORQA, MKQA)에서 두 개의 저자원 언어(한국어, 핀란드어)와 하나의 고자원 언어(중국어)를 포함하는 6개의 instruction-tuned LLM(2.4B ~ 14B parameters)을 사용하여 CrossRAG 및 DKM-RAG를 baseline으로 평가되었습니다. QTT-RAG는 번역 신뢰성을 기반으로 생성 모델이 정보에 입각한 결정을 내릴 수 있도록 하면서, 사실적 무결성을 보존하며, 제한된 자국어 문서가 있는 저자원 환경에서 효과적인 교차 언어 문서 사용을 가능하게 합니다.

시사점, 한계점

시사점:
번역 품질을 명시적으로 평가하고 메타데이터로 활용하여 mRAG 성능 향상.
사실적 무결성을 유지하면서 저자원 환경에서 교차 언어 문서 활용 가능.
다국어 환경에서 실용적이고 강력한 솔루션 제시.
한계점:
논문에서 구체적인 한계점에 대한 언급은 없음. (단, 추가적인 연구 및 개선 가능성 존재)
👍