[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Giải độc ảo giác: Giảm độ nhạy cảm (SenD) để đào tạo mô hình ngôn ngữ lớn

Created by
  • Haebom

Tác giả

Shahrad Mohammadzadeh, Juan David Guerra, Marco Bonizzato, Reihaneh Rabbany, Golnoosh Farnadi

Phác thảo

Bài báo này đề cập đến vấn đề ảo giác trong các mô hình ngôn ngữ quy mô lớn (LLM), tức là tạo ra các kết quả đầu ra không đúng hoặc không liên quan. Sử dụng một loạt các mô hình Pythia, chúng tôi nghiên cứu mối quan hệ giữa sự không chắc chắn trong động lực đào tạo và sự xuất hiện của ảo giác. Chúng tôi xác định được sự biến thiên đáng kể trong quá trình đào tạo và đề xuất Sensitivity Dropout (SenD), một giao thức đào tạo mới loại bỏ một cách quyết định các chỉ số nhúng có độ biến động cao để giải quyết vấn đề này. Chúng tôi cũng phát triển và tích hợp Efficient EigenScore (EES), một thước đo phát hiện ảo giác không giám sát nhanh gấp đôi so với EigenScore thông thường, vào SenD. SenD cải thiện độ tin cậy thời gian kiểm tra của các mô hình Pythia và Llama lên đến 17% và cải thiện độ chính xác thực tế trên Wikipedia, y học, luật pháp và mã hóa mà không ảnh hưởng đến hiệu suất của các tác vụ tiếp theo.

Takeaways, Limitations

Takeaways:
Giới thiệu SenD, một kỹ thuật đào tạo mới nhằm giải quyết vấn đề ảo giác trong LLM.
SenD làm giảm ảo giác bằng cách giảm sự không chắc chắn trong quá trình đào tạo.
Phát triển EES, một công cụ đo lường ảo giác học tập không giám sát hiệu quả.
Xác nhận độ tin cậy được cải thiện và độ chính xác thực tế của các mô hình Pythia và Llama.
Giảm ảo giác mà không ảnh hưởng đến hiệu suất thực hiện nhiệm vụ phụ.
Limitations:
Hiệu ứng của SenD chỉ giới hạn ở các mô hình Pythia và Llama, và khả năng tổng quát hóa của nó sang các kiến trúc LLM khác cần được nghiên cứu thêm.
Mặc dù hiệu suất của EES nhanh gấp đôi so với EigenScore hiện tại, nhưng chi phí tính toán tuyệt đối vẫn là một yếu tố cần cân nhắc.
Cần phải phân tích sâu hơn về tác động của SenD đối với các loại ảo giác khác nhau.
👍