Bài báo này đề cập đến vấn đề đảm bảo rằng một mô hình ngôn ngữ quy mô lớn (LLM) tạo ra đầu ra có cấu trúc tuân thủ các quy tắc cú pháp chính xác, chẳng hạn như các đoạn mã hoặc dữ liệu được định dạng. Giải mã ràng buộc ngữ pháp (GCD) đảm bảo rằng đầu ra LLM tuân thủ các quy tắc này bằng cách che các mã thông báo dẫn đến đầu ra không thuộc về một ngữ pháp phi ngữ cảnh (CFG) nhất định. Các thuật toán GCD hiện có phải tính toán cách các bộ phân tích từ phụ LLM căn chỉnh với các mã thông báo của một CFG nhất định để đảm bảo tính hợp lệ và tính toán các mặt nạ mã thông báo dựa trên thông tin này, điều này rất kém hiệu quả. Bài báo này trình bày một thuật toán GCD mới và việc triển khai nó đạt được quá trình tiền xử lý ngoại tuyến nhanh hơn 17,71 lần so với các phương pháp hiện có, đồng thời vẫn duy trì hiệu quả tiên tiến của tính toán mặt nạ trực tuyến.