본 논문은 음성-텍스트 번역(ST) 시스템의 자동 평가에서 입력 음성 정보를 활용하는 방안을 연구한다. 기존의 참조 기반 평가의 한계를 극복하기 위해, 입력 오디오의 텍스트 프록시를 생성하고 이를 기반으로 소스 인지 메트릭을 적용하는 방법을 제안한다. 특히, 자동 음성 인식(ASR) 전사 및 참조 번역의 역번역을 활용하여 텍스트 프록시를 생성하고, 새로운 교차 언어 재분할 알고리즘을 통해 정렬 문제를 해결한다. 실험을 통해 ASR 전사 및 역번역이 소스 인지 메트릭에 미치는 영향을 분석하고, 보다 정확하고 원칙적인 ST 평가 방법론을 제시한다.