다국어 정보 검색(MLIR) 분야의 발전에도 불구하고, 연구와 실제 적용 사이에는 격차가 존재함. 본 연구에서는 꾸란 다국어 말뭉치의 특성을 활용하여, 이슬람 분야의 특정 사용자 요구를 여러 언어로 충족할 수 있는 임시 IR 시스템 개발을 위한 최적의 전략을 조사함. 단일 언어, 교차 언어, translate-train-all, 그리고 교차 언어와 단일 언어 기법을 결합한 혼합 방식을 포함한 4가지 훈련 접근 방식을 사용하여 11개의 검색 모델을 준비함. 내부 데이터 세트에 대한 평가 결과, 혼합 방식이 다양한 검색 시나리오에서 유망한 결과를 달성함을 보여줌. 또한, 다양한 훈련 구성이 임베딩 공간에 미치는 영향과 다국어 검색 효과에 대한 영향에 대한 상세 분석을 제공함. 마지막으로, 실제 MLIR 애플리케이션을 위한 단일 다용도 경량 모델 배포의 비용 효율성을 강조하며 배포 고려 사항을 논의함.