본 논문은 비정형 문서를 활용한 검색 증강 기계 번역(RAG-MT)을 연구합니다. 기존 연구들은 주로 쌍으로 이루어진 기계 번역 말뭉치나 지식 그래프에서 정보를 검색하여 LLMs의 성능을 향상시켰지만, 본 논문은 다양한 언어의 비정형 문서에 존재하는 방대한 세계 지식을 활용하는 데 초점을 맞춥니다. 이를 위해 연구진은 GPT-4와 인간 번역가를 통해 169,000개의 기계 번역 샘플과 다국어 문서로 구성된 새로운 벤치마크 RAGtrans를 구축했습니다. 또한, 추가적인 라벨링 없이 기존의 다국어 말뭉치를 활용하여 LLMs가 다국어 문서의 정보를 번역에 활용하도록 학습시키는 다중 작업 학습 방법을 제안합니다. 실험 결과, 제안된 방법은 영어-중국어 및 영어-독일어 번역에서 BLEU 및 COMET 점수를 상당히 향상시켰음을 보여줍니다. 마지막으로, 현재 LLMs가 이러한 작업에서 직면하는 어려움을 분석합니다.