Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Vượt ra ngoài SHAP và Anchors: Một thử nghiệm quy mô lớn về cách các nhà phát triển đấu tranh để thiết kế các giải thích có ý nghĩa cho người dùng cuối

Created by
  • Haebom

Tác giả

Zahra Abba Omar, Nadia Nahar, Jacob Tjaden, In es M. Gilles, Fikir Mekonnen, Jane Hsieh, Christian K astner, Alka Menon

Phác thảo

Bài báo này đề cập đến những lo ngại về lòng tin, sự giám sát, an toàn và phẩm giá con người bắt nguồn từ sự thiếu minh bạch của các mô hình học máy hiện đại. Mặc dù các phương pháp giải thích hỗ trợ việc hiểu mô hình, nhưng việc thiết kế các giải thích vừa dễ hiểu vừa hiệu quả cho đối tượng mục tiêu của các nhà phát triển vẫn còn là một thách thức. Một thử nghiệm quy mô lớn với 124 người tham gia đã xem xét cách các nhà phát triển cung cấp giải thích cho người dùng cuối, những thách thức họ gặp phải và mức độ mà các chính sách cụ thể hướng dẫn hành vi của họ. Kết quả cho thấy hầu hết người tham gia đều gặp khó khăn trong việc tạo ra các giải thích chất lượng cao và tuân thủ các chính sách được cung cấp, trong khi bản chất và tính cụ thể của hướng dẫn chính sách ít ảnh hưởng đến hiệu quả. Chúng tôi lập luận rằng điều này bắt nguồn từ việc không hình dung và dự đoán được nhu cầu của các bên liên quan không chuyên về kỹ thuật, và khuyến nghị các biện pháp can thiệp giáo dục dựa trên lý thuyết quá trình nhận thức và trí tưởng tượng xã hội.

Takeaways, Limitations

_____T279640____-: Minh chứng thực tế những khó khăn trong việc giải thích các mô hình học máy hiện đại và việc tuân thủ chính sách của nhà phát triển. Đề xuất nhu cầu can thiệp giáo dục nhằm đáp ứng nhu cầu của các bên liên quan không chuyên về kỹ thuật.
Limitations: Kết quả chỉ giới hạn ở đặc điểm của người tham gia thử nghiệm (nhà phát triển). Khả năng khái quát hóa cho nhiều loại mô hình và ứng dụng học máy khác nhau còn hạn chế. Cần nghiên cứu thêm để xác định hiệu quả của các hướng dẫn chính sách.
👍