본 논문은 전사기(Transducer) 기반 음성 인식 시스템의 빔 서치 속도를 향상시키는 새로운 방법을 제시합니다. 전사기 모델은 정확도, 실시간 처리 성능, 추론 속도 면에서 균형을 잘 맞추지만, 빔 서치는 네트워크의 반복적인 계산으로 속도 저하를 야기합니다. 본 논문에서는 배치 연산, 트리 기반 가설 구조, 개선된 공백 점수 계산, CUDA 그래프 실행 등을 활용하여 ALSD++와 AES++라는 두 가지 최적화된 알고리즘을 구현합니다. 이를 통해 빔 서치와 그리디 디코딩 간의 속도 차이를 10-20% 수준으로 줄이고, 그리디 디코딩 대비 14-30%의 WER 개선, 저자원 환경에서 기존 방법 대비 최대 11%의 얕은 융합 성능 향상을 달성합니다. 모든 알고리즘은 오픈 소스로 공개됩니다.