Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Từ số liệu đến ý nghĩa: Đã đến lúc xem xét lại việc đánh giá trong thiết kế hợp tác giữa con người và AI

Created by
  • Haebom

Tác giả

Sean P. Walton, Ben J. Evans, Alma AM Rahat, James Stovold, Jakub Vincalek

Phác thảo

Bài báo này kêu gọi xem xét lại cách đánh giá các hệ thống cộng tác giữa con người và AI, đồng thời đề xuất một phương pháp tiếp cận đa chiều và tinh vi hơn. Chúng tôi phân tích "Genetic Car Designer", một hệ thống cộng tác giữa con người và AI, thông qua một nghiên cứu thực địa quy mô lớn với 808 người tham gia và một nghiên cứu trong phòng thí nghiệm có kiểm soát với 12 người tham gia. Những người tham gia nhận được đề xuất thiết kế được tạo ra bởi một hệ thống thông minh dựa trên MAP-Elite đã thể hiện sự tương tác về nhận thức và hành vi cao hơn, đồng thời tạo ra kết quả thiết kế chất lượng cao hơn so với những người nhận được đề xuất thiết kế ngẫu nhiên. Chúng tôi chứng minh rằng các phương pháp đánh giá hiện tại chỉ tập trung vào các số liệu về chất lượng thiết kế và hành vi không thể nắm bắt được toàn bộ phạm vi tương tác của người dùng. Chúng tôi lập luận rằng quy trình thiết kế giữa con người và AI nên được coi là một đánh giá toàn diện về các hệ thống AI, xem xét các trạng thái cảm xúc, hành vi và nhận thức đang phát triển của nhà thiết kế. Chúng tôi cũng lập luận rằng các hệ thống thông minh nên được coi là các yếu tố cốt lõi của trải nghiệm người dùng, chứ không chỉ đơn thuần là các công cụ phụ trợ.

Takeaways, Limitations

Takeaways:
Chúng tôi nhấn mạnh những hạn chế của phương pháp tiếp cận đơn giản, lấy chỉ số làm trung tâm hiện tại để đánh giá các hệ thống cộng tác giữa con người và AI và đề xuất nhu cầu về một phương pháp đánh giá đa chiều xem xét các khía cạnh cảm xúc, hành vi và nhận thức.
Chúng tôi chứng minh bằng thực nghiệm rằng các hệ thống thông minh dựa trên MAP-Elites có hiệu quả trong việc cải thiện sự tương tác của người dùng và chất lượng thiết kế.
Nó nhấn mạnh rằng các hệ thống thông minh nên được coi là yếu tố cốt lõi của trải nghiệm người dùng trong các hệ thống AI-con người.
Limitations:
Vì hệ thống được nghiên cứu chỉ giới hạn ở một loại nhiệm vụ thiết kế cụ thể (thiết kế ô tô 2D) nên cần nghiên cứu thêm để xác định khả năng tổng quát hóa của nó cho các loại nhiệm vụ thiết kế khác.
Số lượng người tham gia nghiên cứu trong phòng thí nghiệm bị hạn chế (n=12), đòi hỏi phải xem xét khả năng khái quát hóa của kết quả.
Cần nghiên cứu thêm về các chỉ số và phương pháp đo lường cụ thể để đánh giá toàn diện các khía cạnh cảm xúc, hành vi và nhận thức.
👍