Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Tính mạnh mẽ là quan trọng: Hạn chế của LLM đối với việc khớp dữ liệu

Created by
  • Haebom

Tác giả

Lưu Hà Gia, Mạc Thần Dương, Gediminas Adomavicius

Phác thảo

Bài báo này đề cập đến các lỗ hổng khi sử dụng mô hình ngôn ngữ quy mô lớn (LLM) để khớp dữ liệu và tạo dự đoán. Mặc dù LLM thể hiện hiệu suất dự đoán cạnh tranh trên nhiều tác vụ khác nhau, chúng tôi nhận thấy rằng chúng dễ bị ảnh hưởng bởi những thay đổi không liên quan đến tác vụ trong biểu diễn dữ liệu (ví dụ: đổi tên biến). Hiện tượng này xảy ra trong cả học trong ngữ cảnh và tinh chỉnh có giám sát, cũng như trong cả LLM trọng số đóng và trọng số mở. Phân tích cơ chế chú ý trong LLM trọng số mở cho thấy chúng tập trung quá mức vào các mã thông báo ở các vị trí cụ thể. Ngay cả các mô hình tiên tiến như TabPFN, được đào tạo chuyên biệt cho việc khớp dữ liệu, cũng không tránh khỏi những lỗ hổng này. Do đó, các LLM hiện tại thậm chí còn thiếu mức độ mạnh mẽ cơ bản để được sử dụng như một công cụ khớp dữ liệu có nguyên tắc.

Takeaways, Limitations

Takeaways: Chúng tôi nhấn mạnh rằng khi sử dụng LLM để khớp dữ liệu, chúng ta phải nhận thức được tính dễ bị tổn thương của nó trước những thay đổi trong biểu diễn dữ liệu không liên quan đến nhiệm vụ. Điều này cho thấy cần có thêm nghiên cứu để giải quyết điểm yếu này nhằm tăng cường độ tin cậy vào hiệu suất dự đoán của LLM. Điều này đặt ra nhu cầu về các phương pháp thiết kế và đào tạo LLM mới có tính đến tính mạnh mẽ của biểu diễn dữ liệu.
Limitations: Nghiên cứu này dựa trên kết quả thực nghiệm cho một LLM và tập dữ liệu cụ thể. Do đó, cần nghiên cứu thêm để xác định liệu nghiên cứu này có thể được tổng quát hóa cho tất cả các LLM và tình huống hay không. Nghiên cứu không cung cấp lời giải thích đầy đủ về nguyên nhân gốc rễ của tình trạng dễ bị tổn thương trước những thay đổi không liên quan đến nhiệm vụ. Nghiên cứu cũng không đề xuất các giải pháp cụ thể để giảm thiểu tình trạng dễ bị tổn thương.
👍