[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Giải mã linh hoạt và hiệu quả theo ngữ pháp ràng buộc

Created by
  • Haebom

Tác giả

Kanghee Park, Timothy Zhou, Loris D'Antoni

Phác thảo

Bài báo này đề cập đến vấn đề đảm bảo rằng một mô hình ngôn ngữ quy mô lớn (LLM) tạo ra đầu ra có cấu trúc tuân thủ các quy tắc cú pháp chính xác, chẳng hạn như các đoạn mã hoặc dữ liệu được định dạng. Giải mã ràng buộc ngữ pháp (GCD) đảm bảo rằng đầu ra LLM tuân thủ các quy tắc này bằng cách che các mã thông báo dẫn đến đầu ra không thuộc về một ngữ pháp phi ngữ cảnh (CFG) nhất định. Các thuật toán GCD hiện có phải tính toán cách các bộ phân tích từ phụ LLM căn chỉnh với các mã thông báo của một CFG nhất định để đảm bảo tính hợp lệ và tính toán các mặt nạ mã thông báo dựa trên thông tin này, điều này rất kém hiệu quả. Bài báo này trình bày một thuật toán GCD mới và việc triển khai nó đạt được quá trình tiền xử lý ngoại tuyến nhanh hơn 17,71 lần so với các phương pháp hiện có, đồng thời vẫn duy trì hiệu quả tiên tiến của tính toán mặt nạ trực tuyến.

Takeaways, Limitations

Takeaways:
Chúng tôi đã giảm đáng kể thời gian xử lý trước ngoại tuyến, vốn là điểm nghẽn chính của thuật toán GCD hiện tại (cải thiện 17,71 lần), do đó tăng tính thực tiễn của việc tạo dữ liệu có cấu trúc bằng LLM.
Chúng tôi cung cấp thuật toán GCD phù hợp với các ứng dụng thời gian thực bằng cách cải thiện tốc độ xử lý trước trong khi vẫn duy trì hiệu quả tính toán mặt nạ trực tuyến.
Limitations:
Sự cải thiện hiệu suất của thuật toán được trình bày có thể phụ thuộc vào cách triển khai cụ thể và thuật toán được so sánh. Có thể cần phân tích so sánh bổ sung với các cách triển khai hoặc thuật toán khác.
Cách tiếp cận này bị giới hạn ở ngữ pháp không ngữ cảnh (CFG) và có thể yêu cầu phần mở rộng để xử lý ngữ pháp phức tạp hơn.
ĐáNh giá hiệu suất và kết quả thử nghiệm bổ sung trong các tình huống ứng dụng thực tế có thể bị hạn chế.
👍