Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

ĐịNh lượng tính công bằng trong LLM ngoài mã thông báo: Góc nhìn ngữ nghĩa và thống kê

Created by
  • Haebom

Tác giả

Weijie Xu, Yiwen Wang, Chi Xue, Xiangkun Hu, Xi Fang, Guimin Dong, Chandan K. Reddy

Phác thảo

Các mô hình ngôn ngữ quy mô lớn (LLM) thường tạo ra các phản hồi có sai lệch cố hữu, làm giảm độ tin cậy của chúng trong các ứng dụng thực tế. Các phương pháp đánh giá hiện tại thường bỏ qua các sai lệch cố hữu trong các phản hồi dạng dài và tính biến thiên cố hữu trong đầu ra của LLM. Để giải quyết những thách thức này, bài báo này đề xuất So sánh ngữ nghĩa chi tiết (FiSCo), một khuôn khổ thống kê mới để đánh giá tính công bằng ở cấp độ nhóm trong LLM bằng cách phát hiện những khác biệt ngữ nghĩa tinh tế trong các phản hồi dạng dài giữa các nhóm nhân khẩu học. Không giống như các nghiên cứu trước đây tập trung vào so sánh ở cấp độ cảm xúc hoặc mã thông báo, FiSCo phân tích các phản hồi ở cấp độ ngữ nghĩa bằng cách tận dụng các kiểm tra hàm ý để đánh giá tính nhất quán ngữ nghĩa. Nó phân tích các đầu ra của mô hình thành các tuyên bố riêng biệt về mặt ngữ nghĩa và áp dụng kiểm định giả thuyết thống kê để so sánh các điểm tương đồng giữa và trong nhóm, cho phép phát hiện mạnh mẽ các sai lệch tinh vi. Chúng tôi chính thức hóa một định nghĩa mới về tính công bằng phản thực tế của nhóm và xác thực FiSCo trên các tập dữ liệu tổng hợp và được chú thích bởi con người bao gồm giới tính, chủng tộc và độ tuổi. Kết quả thử nghiệm chứng minh rằng FiSCo vượt trội hơn nhiều chỉ số đánh giá khác nhau trong việc xác định các sai lệch tinh vi một cách đáng tin cậy hơn đồng thời giảm thiểu tác động của biến động LLM ngẫu nhiên.

Takeaways, Limitations

Takeaways:
Đề Xuất một khuôn khổ thống kê mới, FiSCo, để đánh giá tính công bằng ở cấp độ nhóm trong LLM.
Giải quyết các vấn đề về sai lệch trong các phản hồi dài và tính biến thiên trong đầu ra LLM, vốn là những hạn chế của các phương pháp hiện có.
Phát hiện sự thiên vị tinh vi và cho phép đánh giá mạnh mẽ thông qua phân tích cấp độ ngữ nghĩa.
Một định nghĩa mới về công bằng phản thực tế của nhóm
Tiến hành xác thực thử nghiệm trên nhiều nhóm nhân khẩu học khác nhau, bao gồm giới tính, chủng tộc và độ tuổi.
Đã Xác nhận hiệu suất vượt trội so với các chỉ số đánh giá hiện có
Limitations:
Hiệu suất của FiSCo có thể phụ thuộc vào tập dữ liệu được sử dụng và chất lượng chú thích.
Có thể không phải tất cả các loại thiên kiến ​​đều có thể được phát hiện hoàn hảo.
Chi phí tính toán có thể cao.
Cần có thêm nghiên cứu về khả năng khái quát hóa của định nghĩa công bằng phản thực tế nhóm mới.
👍