Bài báo này trình bày một khuôn khổ mới cho việc phát hiện ký hiệu, giúp nhận dạng và định vị các ký hiệu riêng lẻ trong các video ngôn ngữ ký hiệu liên tục, nhằm giải quyết vấn đề thiếu hụt dữ liệu trong dịch thuật ngôn ngữ ký hiệu. Để giải quyết vấn đề về tính linh hoạt từ vựng và sự mơ hồ của các phương pháp phát hiện ký hiệu hiện có, chúng tôi đề xuất một phương pháp tiếp cận không huấn luyện, tích hợp mô hình ngôn ngữ quy mô lớn (LLM). Chúng tôi trích xuất các đặc điểm không gian-thời gian và bàn tay, sau đó so sánh chúng với một từ điển ngôn ngữ ký hiệu lớn bằng cách sử dụng kỹ thuật bẻ cong thời gian động và độ tương đồng cosin. Sau đó, chúng tôi tận dụng LLM để thực hiện việc loại bỏ sự mơ hồ từ vựng theo ngữ cảnh bằng cách sử dụng tìm kiếm chùm tia. Kết quả thử nghiệm trên các tập dữ liệu ngôn ngữ ký hiệu tổng hợp và thực tế cho thấy độ chính xác và độ trôi chảy của câu được cải thiện so với các phương pháp hiện có.