Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Tự phản ánh theo hướng chú ý để phát hiện ảo giác không cần bắn trong các mô hình ngôn ngữ lớn

Created by
  • Haebom

Tác giả

Cường Lưu, Xin Long Trần, Nhạc Đinh, Bowen Song, Vương Duy Cường, Thục Ngô, Lương Vương

Phác thảo

Bài báo này đề xuất một phương pháp mới, Phản xạ tự hướng dẫn theo sự chú ý (AGSER), để giải quyết vấn đề ảo giác, cản trở việc áp dụng hiệu quả các mô hình ngôn ngữ quy mô lớn (LLM). AGSER tận dụng sự đóng góp của sự chú ý để phân loại các câu hỏi đầu vào thành các câu hỏi tập trung vào sự chú ý và không tập trung vào sự chú ý. Đối với mỗi câu hỏi, nó xử lý riêng LLM để tính điểm nhất quán giữa câu trả lời được tạo ra và câu trả lời ban đầu. Sự khác biệt giữa hai điểm nhất quán được sử dụng làm phép đo ảo giác. AGSER không chỉ cải thiện hiệu quả phát hiện ảo giác mà còn giảm đáng kể chi phí tính toán bằng cách chỉ sử dụng ba lần chạy qua LLM và hai bộ mã thông báo. Các thí nghiệm mở rộng sử dụng bốn LLM được sử dụng rộng rãi và ba điểm chuẩn ảo giác chứng minh rằng phương pháp được đề xuất vượt trội hơn đáng kể so với các phương pháp hiện có trong việc phát hiện ảo giác.

Takeaways, Limitations

Takeaways:
Một phương pháp mới để cải thiện hiệu suất phát hiện ảo giác bằng cách sử dụng cơ chế chú ý được trình bày.
ĐạT được hiệu suất phát hiện ảo giác cao với chi phí tính toán thấp hơn so với các phương pháp hiện có.
Hiệu quả được xác minh trong nhiều LLM và tiêu chuẩn khác nhau.
Limitations:
Cần nghiên cứu thêm về hiệu suất tổng quát của phương pháp đề xuất.
Có khả năng hiệu suất giảm sút đối với một số loại ảo giác.
Cần phải đánh giá hiệu suất trong môi trường ứng dụng thực tế.
👍