본 논문은 기존의 일대일 음성-텍스트 번역(ST) 시스템을 기반으로, 재훈련 없이 다국어 음성-텍스트 번역 시스템을 구축하는 방법을 제시합니다. 기존의 작업 산술(task arithmetic) 방법을 직접 적용하면 언어 혼동이 발생하므로, 언어 제어 모델을 통합한 증강된 작업 산술 방법을 제안합니다. 이 방법은 MuST-C와 CoVoST-2 데이터셋에서 BLEU 점수를 최대 4.66 및 4.92 향상시키고, COMET 점수를 8.87 및 11.83 향상시키는 결과를 보였습니다. 또한, 기존의 기계 번역(MT) 및 ST 모델을 기반으로 ST 모델을 합성하여, 쌍으로 된 ST 훈련 데이터나 사전 훈련된 ST 모델이 없는 언어 쌍으로도 확장 가능함을 보여줍니다.