Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Nén nhắc nhở LLM có hướng dẫn về cây phân tích cú pháp

Created by
  • Haebom

Tác giả

Wenhao Mao, Chengbin Hou, Tianyu Zhang, Xinyu Lin, Ke Tang, Hairong Lv.

Phác thảo

Bài báo này khám phá cách cung cấp ngữ cảnh phong phú để cải thiện hiệu suất của các mô hình ngôn ngữ quy mô lớn (LLM). Để giải quyết vấn đề chi phí tính toán tăng cao của các câu lệnh dài và kích thước đầu vào hạn chế của LLM, chúng tôi đề xuất PartPrompt, một phương pháp nén chọn lọc mới khắc phục được những hạn chế của các phương pháp nén sinh và nén chọn lọc hiện có. PartPrompt sử dụng cây cú pháp dựa trên quy tắc ngôn ngữ để tính toán entropy thông tin của mỗi nút và dựa trên điều này, xây dựng một cây toàn cục xem xét cấu trúc phân cấp (sự phụ thuộc giữa các câu, đoạn văn và phần). Nó điều chỉnh các giá trị nút thông qua quá trình lan truyền từ dưới lên và từ trên xuống trên cây toàn cục, sau đó nén các câu lệnh bằng cách cắt tỉa cây bằng thuật toán đệ quy dựa trên các giá trị nút đã điều chỉnh. Kết quả thử nghiệm chứng minh rằng PartPrompt đạt được hiệu suất tiên tiến trên nhiều tập dữ liệu, số liệu đánh giá, tỷ lệ nén và LLM khác nhau. Nó cũng thể hiện sự vượt trội về tính gắn kết của các câu lệnh được nén và trong các tình huống câu lệnh cực dài.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một phương pháp nén nhanh mới có hiệu quả giải quyết các vấn đề về hạn chế đầu vào và chi phí tính toán của LLM.
Khắc phục những hạn chế của các phương pháp hiện có bằng cách xem xét các quy tắc ngôn ngữ và cấu trúc toàn cục.
ĐạT được hiệu suất tiên tiến trên nhiều tập dữ liệu khác nhau và LLM.
Cải thiện tính gắn kết của các lời nhắc được nén.
Đã đượC chứng minh là có hiệu quả ngay cả với những lời nhắc cực kỳ dài.
Limitations:
Hiệu suất của PartPrompt có thể phụ thuộc vào độ chính xác của các quy tắc ngôn ngữ và phân tích cú pháp.
Cần có thêm nghiên cứu về hiệu suất tổng quát cho các ngôn ngữ hoặc miền cụ thể.
Cần phải đánh giá hiệu quả xử lý của các lời nhắc có cấu trúc rất phức tạp.
👍