Sign In

MultiMed-ST: Large-scale Many-to-many Multilingual Medical Speech Translation

Created by
  • Haebom
Category
Empty

저자

Khai Le-Duc, Tuyen Tran, Bach Phan Tat, Nguyen Kim Hai Bui, Quan Dang, Hung-Phong Tran, Thanh-Thuy Nguyen, Ly Nguyen, Tuan-Minh Phan, Thi Thu Phuong Tran, Chris Ngo, Nguyen X. Khanh, Thanh Nguyen-Tang

개요

의료 분야의 다국어 음성 번역(ST)과 기계 번역(MT)은 언어 장벽을 넘어 효율적인 의사 소통을 가능하게 하여 환자 관리를 향상시킨다. 또한 전문 인력 부족을 완화하고, 특히 팬데믹 상황에서 진단 및 치료를 개선하는 데 기여한다. 본 연구에서는 의료 분야의 첫 번째 체계적인 ST 연구를 제시하며, 5개 언어(베트남어, 영어, 독일어, 프랑스어, 중국어 간체/번체)의 모든 번역 방향을 포괄하는 대규모 ST 데이터 세트인 MultiMed-ST와 모델을 공개한다. MultiMed-ST는 290,000개의 샘플을 포함하며, 모든 도메인 중 가장 큰 의료 MT 데이터 세트이자 가장 큰 다대다 다국어 ST 데이터 세트이다. 또한, 경험적 기준선, 이중 언어-다국어 비교 연구, 종단간(end-to-end) vs. 계층적(cascaded) 비교 연구, 작업별 vs. 다중 작업 시퀀스-투-시퀀스 비교 연구, 코드 전환 분석, 정량적-정성적 오류 분석 등 분야 역사상 가장 포괄적인 ST 분석을 수행한다.

시사점, 한계점

시사점:
의료 분야에서 대규모 ST 데이터 세트 MultiMed-ST를 최초로 공개하여 연구의 기반을 마련함.
다양한 비교 연구를 통해 ST 모델 성능과 특징을 심층적으로 분석함.
모든 코드, 데이터, 모델을 공개하여 연구의 재현 및 활용을 용이하게 함.
한계점:
구체적인 한계점에 대한 언급은 논문 요약에 포함되어 있지 않음.
👍