Sign In

How to Evaluate Speech Translation with Source-Aware Neural MT Metrics

Created by
  • Haebom
Category
Empty

저자

Mauro Cettolo, Marco Gaido, Matteo Negri, Sara Papi, Luisa Bentivogli

개요

본 논문은 음성-텍스트 번역(ST) 시스템의 자동 평가에서 입력 음성 정보를 활용하는 방안을 연구한다. 기존의 참조 기반 평가의 한계를 극복하기 위해, 입력 오디오의 텍스트 프록시를 생성하고 이를 기반으로 소스 인지 메트릭을 적용하는 방법을 제안한다. 특히, 자동 음성 인식(ASR) 전사 및 참조 번역의 역번역을 활용하여 텍스트 프록시를 생성하고, 새로운 교차 언어 재분할 알고리즘을 통해 정렬 문제를 해결한다. 실험을 통해 ASR 전사 및 역번역이 소스 인지 메트릭에 미치는 영향을 분석하고, 보다 정확하고 원칙적인 ST 평가 방법론을 제시한다.

시사점, 한계점

시사점:
ST 평가에서 소스 정보를 활용하는 새로운 접근 방식을 제시하여 평가 정확도를 향상시킬 수 있는 가능성을 보여줌.
ASR 전사 및 역번역을 활용한 텍스트 프록시 생성 방식을 제안하고, 각 방식의 장단점을 분석함.
교차 언어 재분할 알고리즘을 통해 소스 인지 메트릭의 적용 가능성을 확대함.
79개의 언어 쌍과 다양한 ST 시스템에 대한 실험을 통해 방법론의 일반화 가능성을 검증함.
한계점:
ASR 성능에 따라 결과가 달라질 수 있으며, ASR 성능이 낮은 경우 활용성이 제한될 수 있음.
역번역 품질에 따라 결과가 달라질 수 있음.
제안된 방법론이 특정 ST 시스템이나 언어 쌍에 편향될 가능성을 배제하기 어려움.
실제 환경에서의 적용 및 성능 최적화에 대한 추가적인 연구가 필요함.
👍