본 연구는 다국어 정보 검색(CLIR)의 어려움을 해결하기 위해 네 가지 개입 유형(문서 번역, 사전 훈련된 인코더를 사용한 다국어 밀집 검색, 단어, 구 및 쿼리-문서 수준의 대조 학습, 교차 인코더 재순위)을 체계적으로 평가합니다. 연구 결과, CLIR을 위해 특별히 훈련된 밀집 검색 모델이 어휘 매칭 방법보다 일관되게 우수하며 문서 번역으로부터 거의 이점을 얻지 못한다는 것을 발견했습니다. 대조 학습은 언어 편향을 완화하고 초기 정렬이 약한 인코더에 대해 상당한 개선을 가져오며, 재순위는 효과적일 수 있지만 교차 인코더 훈련 데이터의 품질에 달려 있습니다.