Bài báo này đề xuất phương pháp ASR ngữ cảnh mạnh mẽ tăng cường âm vị thông qua khử nhập nhằng thực thể đối chiếu (PARCO) để giải quyết những thách thức mà các hệ thống nhận dạng giọng nói tự động (ASR) đang gặp phải, vốn gặp khó khăn với các thực thể được đặt tên theo miền cụ thể, đặc biệt là các từ đồng âm. PARCO tích hợp mã hóa nhận biết âm vị, khử nhập nhằng thực thể đối chiếu, giám sát cấp thực thể và lọc thực thể phân cấp để cải thiện khả năng phân biệt giọng nói, đảm bảo phát hiện thực thể hoàn chỉnh và giảm các kết quả dương tính giả trong điều kiện không chắc chắn. Phương pháp này đạt tỷ lệ lỗi ký tự (CER) là 4,22% trên tập dữ liệu AISHELL-1 tiếng Trung và tỷ lệ lỗi từ (WER) là 11,14% trên tập dữ liệu DATA2 tiếng Anh dưới 1.000 từ gây nhiễu, vượt trội đáng kể so với các phương pháp hiện có. Phương pháp này cũng cho thấy những cải thiện hiệu suất mạnh mẽ trên các tập dữ liệu miền cụ thể như THCHS-30 và LibriSpeech.