Bài báo này đề cập đến vấn đề nhận dạng các từ khóa cụ thể trong nhận dạng giọng nói tự động (ASR) nhận biết ngữ cảnh. Các kỹ thuật thiên về ngữ cảnh hiện có có những hạn chế, chẳng hạn như yêu cầu đào tạo mô hình bổ sung, tốc độ giải mã chậm và các loại hệ thống ASR hạn chế. Trong bài báo này, chúng tôi đề xuất một khuôn khổ thiên về ngữ cảnh ASR đa năng hỗ trợ tất cả các loại mô hình ASR chính, bao gồm các mô hình CTC, Transducer và Attention Encoder-Decoder. Sử dụng cây tăng cường từ được tăng tốc bằng GPU, khuôn khổ hoạt động ở chế độ hợp nhất nông mà không bị chậm lại trong giải mã tìm kiếm tham lam và chùm tia, ngay cả với tối đa 20.000 từ khóa. Kết quả thử nghiệm chứng minh rằng phương pháp được đề xuất vượt trội hơn các kỹ thuật thiên về ngữ cảnh nguồn mở hiện có về độ chính xác và tốc độ giải mã. Khuôn khổ thiên về ngữ cảnh được đề xuất đã được mã nguồn mở như một phần của bộ công cụ NeMo.