의료 분야의 다국어 음성 번역(ST)과 기계 번역(MT)은 언어 장벽을 넘어 효율적인 의사 소통을 가능하게 하여 환자 관리를 향상시킨다. 또한 전문 인력 부족을 완화하고, 특히 팬데믹 상황에서 진단 및 치료를 개선하는 데 기여한다. 본 연구에서는 의료 분야의 첫 번째 체계적인 ST 연구를 제시하며, 5개 언어(베트남어, 영어, 독일어, 프랑스어, 중국어 간체/번체)의 모든 번역 방향을 포괄하는 대규모 ST 데이터 세트인 MultiMed-ST와 모델을 공개한다. MultiMed-ST는 290,000개의 샘플을 포함하며, 모든 도메인 중 가장 큰 의료 MT 데이터 세트이자 가장 큰 다대다 다국어 ST 데이터 세트이다. 또한, 경험적 기준선, 이중 언어-다국어 비교 연구, 종단간(end-to-end) vs. 계층적(cascaded) 비교 연구, 작업별 vs. 다중 작업 시퀀스-투-시퀀스 비교 연구, 코드 전환 분석, 정량적-정성적 오류 분석 등 분야 역사상 가장 포괄적인 ST 분석을 수행한다.