Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Xóa bỏ định kiến ​​xã hội cho chương trình Thạc sĩ Luật Đa phương thức Công bằng

Created by
  • Haebom

Tác giả

Harry Cheng, Yangyang Guo, Qingpei Guo, Ming Yang, Tian Gan, Weili Guan, Liqiang Nie

Phác thảo

Bài báo này trình bày hai đóng góp chính nhằm giải quyết vấn đề thiên kiến ​​xã hội trong các mô hình ngôn ngữ quy mô lớn đa phương thức (MLLM). Đầu tiên, chúng tôi giới thiệu Bộ dữ liệu phản thực toàn diện (CMSC), bao gồm 18 khái niệm xã hội đa dạng và cân bằng. CMSC bổ sung cho các bộ dữ liệu hiện có, cho phép áp dụng một phương pháp toàn diện hơn để giảm thiểu thiên kiến ​​xã hội. Thứ hai, chúng tôi đề xuất một chiến lược khử thiên kiến ​​phản khuôn mẫu (CSD) để giảm thiểu thiên kiến ​​xã hội trong MLLM bằng cách tận dụng khái niệm phản khuôn mẫu về các khuôn mẫu phổ biến. CSD tích hợp một phương pháp lấy mẫu dữ liệu nhận biết thiên kiến ​​mới và cân bằng lại tổn thất để nâng cao hiệu quả giảm thiên kiến ​​của mô hình. Các thí nghiệm mở rộng sử dụng bốn kiến ​​trúc MLLM chính chứng minh rằng bộ dữ liệu CMSC và chiến lược CSD làm giảm hiệu quả thiên kiến ​​xã hội so với các phương pháp hiện có, đạt được điều này mà không ảnh hưởng đến hiệu suất tổng thể trên các chuẩn mực suy luận đa phương thức chung.

Takeaways, Limitations

Takeaways:
Góp phần giải quyết vấn đề thiên vị xã hội trong MLLM bằng cách cung cấp một tập dữ liệu phản thực tế mới (CMSC) bao gồm các khái niệm xã hội đa dạng và cân bằng.
Chúng tôi trình bày một chiến lược chống định kiến ​​xã hội (CSD) mới giúp giảm định kiến ​​xã hội trong MLLM hiệu quả hơn các phương pháp hiện có.
Chiến lược CSD đạt được mục tiêu giảm độ lệch mà không ảnh hưởng đến hiệu suất suy luận đa phương thức chung.
Chúng tôi xác nhận hiệu quả của CMSC và CSD thông qua các thử nghiệm mở rộng trên nhiều kiến ​​trúc MLLM khác nhau.
Limitations:
Phạm vi bao phủ các khái niệm xã hội của bộ dữ liệu CMSC có thể chưa đầy đủ. Nó cần được mở rộng để bao gồm nhiều khái niệm xã hội hơn.
Hiệu quả của chiến lược CSD có thể khác nhau tùy thuộc vào kiến ​​trúc MLLM cụ thể và dữ liệu đào tạo được sử dụng. Cần nghiên cứu thêm về các mô hình và dữ liệu khác.
Có thể cần nghiên cứu thêm để xác định và đo lường định kiến ​​xã hội. Cần xem xét nhiều chỉ số đo lường và phương pháp đánh giá khác nhau.
👍