Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Khi ô tô có khuôn mẫu: Kiểm toán sự thiên vị nhân khẩu học trong các đối tượng từ mô hình văn bản sang hình ảnh

Created by
  • Haebom

Tác giả

Dasol Choi, Jihwan Lee, Minjae Lee, Minsuk Kahng

Phác thảo

Ngoài việc nghiên cứu sự thiên vị trong miêu tả của con người trong các mô hình tạo văn bản thành hình ảnh, bài báo này còn tìm hiểu về sự thiên vị nhân khẩu học trong chính các đối tượng (ví dụ: ô tô). Chúng tôi trình bày một khuôn khổ mới, Kiểm toán Chẩn đoán Đối tượng Định kiến (SODA), tạo ra 2.700 hình ảnh thuộc năm loại đối tượng bằng ba mô hình tiên tiến (GPT Image-1, Imagen 4 và Stable Diffusion) và so sánh kết quả tạo ra bằng cách sử dụng các tín hiệu nhân khẩu học (ví dụ: "dành cho người trẻ") với các kết quả được tạo ra bằng các gợi ý trung tính. Phân tích của chúng tôi cho thấy mối liên hệ chặt chẽ giữa các nhóm nhân khẩu học cụ thể và các thuộc tính thị giác (ví dụ: các mẫu màu lặp lại được kích hoạt bởi các gợi ý về giới tính hoặc dân tộc). Những mẫu này phản ánh và củng cố không chỉ các khuôn mẫu phổ biến mà còn cả những thiên vị tinh vi và phản trực giác hơn. Hơn nữa, chúng tôi nhận thấy rằng một số mô hình tạo ra đầu ra có độ đa dạng thấp, khuếch đại sự khác biệt về thị giác so với các gợi ý trung tính. Khuôn khổ kiểm toán được đề xuất cung cấp một cách thực tế để khám phá những thiên vị vẫn còn tồn tại trong các mô hình tạo hình hiện nay và trình bày chúng như một bước thiết yếu hướng tới sự phát triển AI có hệ thống và có trách nhiệm hơn.

Takeaways, Limitations

Takeaways:
Chúng tôi tiết lộ sự hiện diện của các thành kiến nhân khẩu học đối với các đối tượng trong các mô hình tạo văn bản thành hình ảnh.
Những thành kiến này phản ánh và củng cố các khuôn mẫu, đồng thời cũng cho thấy chúng bao gồm những thành kiến tinh vi và phản trực giác.
Trình bày phương pháp thực tế để đo lường và đánh giá một cách có hệ thống độ lệch của các mô hình tạo sinh thông qua khuôn khổ SODA.
Trình bày một bước quan trọng hướng tới sự phát triển AI có trách nhiệm hơn.
Limitations:
Khả năng khái quát hóa có thể bị hạn chế do những hạn chế trong mô hình và tập dữ liệu được sử dụng trong phân tích.
Cần phải xác nhận thêm tính khách quan và độ tin cậy của khuôn khổ SODA.
Thiếu phân tích sâu sắc về nguyên nhân gốc rễ của sự thiên vị và giải pháp.
👍