[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Khám phá các hiệu ứng về tính cách Big Five và khả năng AI trong các cuộc đối thoại đàm phán mô phỏng LLM

Created by
  • Haebom

Tác giả

Myke C. Cohen, Zhe Su, Hsien-Te Kao, Daniel Nguyen, Spencer Lynch, Maarten Sap, Svitlana ROLova

Phác thảo

Bài báo này trình bày một khuôn khổ đánh giá cho các hệ thống AI của tác nhân trong các tình huống đàm phán quan trọng đối với nhiệm vụ. Bài báo giải quyết nhu cầu về các tác nhân AI có thể thích ứng với nhiều người vận hành và bên liên quan. Sử dụng môi trường mô phỏng Sotopia, chúng tôi đánh giá một cách có hệ thống cách các đặc điểm tính cách và đặc điểm của tác nhân AI ảnh hưởng đến kết quả của các cuộc đàm phán xã hội mô phỏng LLM trong hai thí nghiệm, điều này rất cần thiết cho nhiều ứng dụng bao gồm phối hợp giữa các nhóm và tương tác dân sự-quân sự. Trong Thí nghiệm 1, chúng tôi sử dụng các phương pháp khám phá nhân quả để đo lường tác động của các đặc điểm tính cách đối với các cuộc đàm phán giá cả, nhận thấy rằng sự dễ chịu và hướng ngoại ảnh hưởng đáng kể đến độ tin cậy, thành tích đạt được mục tiêu và kết quả tiếp thu kiến ​​thức. Sử dụng thước đo vốn từ vựng nhận thức xã hội được trích xuất từ ​​giao tiếp nhóm, chúng tôi phát hiện ra những khác biệt tinh tế trong giao tiếp đồng cảm, nền tảng đạo đức và các mô hình quan điểm của tác nhân, cung cấp những hiểu biết có thể hành động cho các hệ thống AI của tác nhân phải hoạt động đáng tin cậy trong các tình huống hoạt động có rủi ro cao. Trong Thí nghiệm 2, chúng tôi đánh giá các cuộc đàm phán công việc giữa con người và AI bằng cách thao túng tính cách con người được mô phỏng và các đặc điểm của hệ thống AI (cụ thể là tính minh bạch, năng lực và khả năng thích ứng) để chứng minh cách độ tin cậy của các tác nhân AI ảnh hưởng đến hiệu quả của nhiệm vụ. Những kết quả này hỗ trợ trực tiếp các yêu cầu hoạt động đối với các hệ thống AI đáng tin cậy bằng cách thiết lập một phương pháp đánh giá có thể lặp lại để kiểm tra độ tin cậy của các tác nhân AI trên nhiều tính cách của người vận hành và động lực nhóm tác nhân-con người. Nghiên cứu này thúc đẩy việc đánh giá các quy trình làm việc của tác nhân AI bằng cách vượt ra ngoài các số liệu hiệu suất tiêu chuẩn và kết hợp các động lực xã hội cần thiết cho sự thành công của nhiệm vụ trong các hoạt động phức tạp.

Takeaways, Limitations

Takeaways:
Trình bày một khuôn khổ có thể lặp lại để đánh giá độ tin cậy của các hệ thống AI của tác nhân trong các tình huống đàm phán có tầm quan trọng cao.
Cung cấp bằng chứng thực nghiệm về tác động của các đặc điểm tính cách (dễ chịu, hướng ngoại) và đặc điểm của tác nhân AI (minh bạch, năng lực, khả năng thích ứng) đến kết quả đàm phán.
Đề Xuất khả năng phân tích giao tiếp đồng cảm, nền tảng đạo đức và mô hình quan điểm của các tác nhân thông qua phép đo vốn từ vựng nhận thức xã hội.
Nhấn mạnh tầm quan trọng của việc đánh giá các hệ thống AI ngoài các số liệu hiệu suất tiêu chuẩn và xem xét đến động lực xã hội.
Limitations:
Vì các thí nghiệm được tiến hành bằng môi trường mô phỏng Sotopia nên cần nghiên cứu thêm để xác định khả năng khái quát hóa thành các tình huống thực tế.
Vì chúng tôi chỉ xem xét các đặc điểm tính cách cụ thể và đặc điểm của tác nhân AI nên cần nghiên cứu thêm về ảnh hưởng của các yếu tố khác.
Vì chúng tôi mô phỏng con người bằng LLM nên có khả năng nó không phản ánh đầy đủ sự phức tạp của con người thực.
👍