본 논문은 문맥 인식 자동 음성 인식(ASR)에서 특정 키워드를 인식하는 문제를 다룬다. 기존의 문맥 편향 기법들은 추가적인 모델 훈련이 필요하거나, 디코딩 속도가 느리거나, ASR 시스템 유형의 선택에 제약이 있는 한계를 가지고 있다. 본 논문에서는 CTC, Transducer, Attention Encoder-Decoder 모델 등 주요 ASR 모델 유형을 모두 지원하는 범용적인 ASR 문맥 편향 프레임워크를 제안한다. 이 프레임워크는 GPU 가속 기반의 단어 부스팅 트리를 사용하여, 최대 2만 개의 키워드를 사용하더라도 greedy 및 beam search 디코딩에서 속도 저하 없이 shallow fusion 모드로 작동한다. 실험 결과, 제안된 방법은 기존의 오픈소스 문맥 편향 기법들보다 정확도와 디코딩 속도 면에서 우수한 성능을 보였다. 제안된 문맥 편향 프레임워크는 NeMo 툴킷의 일부로 오픈소스로 공개되었다.