Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

TECP: Dự đoán phù hợp Token-Entropy cho LLM

Created by
  • Haebom

Tác giả

Bị Từ, Yongming Lu

Phác thảo

Bài báo này đề xuất Dự đoán Tuân thủ Token-Entropy (TECP), một khuôn khổ mới tận dụng entropy token để giải quyết vấn đề lượng hóa bất định (UQ) cho việc tạo ngôn ngữ mở trong các ràng buộc hộp đen. TECP sử dụng entropy cấp token làm thước đo bất định, không có logit hoặc tham chiếu, và tích hợp nó vào một quy trình Dự đoán Tuân thủ (CP) riêng biệt để tạo ra một tập hợp các dự đoán với các đảm bảo bao phủ chính thức. Không giống như các phương pháp hiện có dựa trên các phương pháp heuristic nhất quán ngữ nghĩa hoặc các đặc trưng hộp trắng, TECP trực tiếp ước tính bất định nhận thức từ cấu trúc entropy token của các sản phẩm được lấy mẫu và hiệu chỉnh ngưỡng bất định thông qua các phân vị CP, đảm bảo kiểm soát lỗi có thể xác minh. Các đánh giá thử nghiệm trên sáu mô hình ngôn ngữ quy mô lớn và hai điểm chuẩn (CoQA và TriviaQA) chứng minh rằng TECP luôn đạt được độ bao phủ đáng tin cậy và các tập dự đoán nhỏ gọn, vượt trội hơn các phương pháp UQ dựa trên tính tự nhất quán trước đây. Nghiên cứu này cung cấp một giải pháp có nguyên tắc và hiệu quả cho việc tạo ra đáng tin cậy trong bối cảnh LLM hộp đen.

Takeaways, Limitations

Takeaways:
Một cách tiếp cận mới để định lượng sự không chắc chắn trong LLM hộp đen.
ĐO lường sự không chắc chắn hiệu quả và có nguyên tắc bằng cách sử dụng entropy mã thông báo mà không cần logit hoặc tham chiếu.
Kiểm soát lỗi có thể xác minh và đảm bảo phạm vi phủ sóng đáng tin cậy thông qua dự đoán tham chiếu.
Phương pháp này cho thấy hiệu suất tốt hơn so với các phương pháp hiện có dựa trên tính nhất quán.
Limitations:
Cần có thêm nghiên cứu về hiệu suất tổng quát của phương pháp được trình bày trong bài báo này.
Có thể cần phải thực hiện thêm các thử nghiệm với các loại LLM và chuẩn mực khác nhau.
Cần phải phân tích so sánh với các biện pháp không chắc chắn khác ngoài entropy mã thông báo.
👍