본 논문은 기존의 일대일 음성-텍스트 번역 시스템을 기반으로, 재훈련 없이 다국어 음성-텍스트 번역 시스템을 구축하는 방법을 제시한다. 기존의 작업 산술(task arithmetic) 방식을 직접 적용하면 언어 혼동이 발생하기 때문에, 언어 제어 모델을 추가하여 정확한 타겟 언어 생성을 보장하는 증강된 작업 산술 방법을 제안한다. MuST-C와 CoVoST-2 데이터셋을 사용한 실험 결과, BLEU 점수가 최대 4.66 및 4.92 향상되었고, COMET 점수는 8.87 및 11.83 향상되었다. 또한, 기존의 기계 번역(MT) 및 음성-텍스트 번역 모델을 이용하여 새로운 언어 쌍에 대한 음성-텍스트 번역 모델을 합성하는 방법도 제시한다.