Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Tối đa hóa mềm dựa trên mô hình các số liệu phù hợp về sức mạnh con người dài hạn

작성자
  • Haebom

Tác giả

Jobst Heitzig, Ram Potham

Phác thảo

Bài báo này khám phá khái niệm "quyền lực", một khái niệm then chốt trong an toàn AI. Bài báo đề cập đến việc theo đuổi quyền lực như một mục tiêu trong AI, sự mất mát đột ngột hoặc dần dần quyền lực của con người, và sự cân bằng quyền lực trong tương tác giữa con người và AI cũng như quản trị AI quốc tế. Đồng thời, quyền lực, với tư cách là khả năng theo đuổi nhiều mục tiêu, là yếu tố thiết yếu cho hạnh phúc của con người. Bài báo này khám phá ý tưởng thúc đẩy cả sự an toàn và hạnh phúc bằng cách cho phép các tác nhân AI nâng cao rõ ràng quyền lực của con người và quản lý sự cân bằng quyền lực giữa con người và các tác nhân AI theo cách mong muốn. Sử dụng một phương pháp tiếp cận có nguyên tắc và một phần tiên đề, chúng tôi thiết kế một hàm mục tiêu có thể tham số hóa và phân tích được, thể hiện sự bất bình đẳng quyền lực của con người và sự tổng hợp dài hạn không ưa rủi ro. Hàm mục tiêu này tính đến tính duy lý bị giới hạn của con người và các chuẩn mực xã hội, và quan trọng là các mục tiêu đa dạng của con người. Chúng tôi xây dựng một thuật toán để tính toán số liệu này thông qua quy nạp ngược hoặc một hình thức học tăng cường đa tác nhân từ một mô hình thế giới nhất định. Chúng tôi minh họa kết quả của việc tối đa hóa (một cách trơn tru) số liệu này trong các tình huống khác nhau và giải thích các mục tiêu phụ mang tính công cụ mà nó bao hàm. Đánh giá cẩn thận cho thấy rằng việc tối đa hóa một cách nhẹ nhàng thước đo tổng hợp thích hợp về sức mạnh của con người có thể là mục tiêu có lợi hơn cho các hệ thống AI tác nhân an toàn so với mục tiêu trực tiếp dựa trên tiện ích.

Takeaways, Limitations

Takeaways:
Việc đặt mục tiêu AI nâng cao sức mạnh của con người là một cách tiếp cận mới có thể đồng thời thúc đẩy sự an toàn của AI và phúc lợi của con người.
Nó cung cấp phương pháp thiết kế hàm mục tiêu AI thực tế hơn, có tính đến nhiều mục tiêu khác nhau của con người, lý trí hạn chế và chuẩn mực xã hội.
Chúng tôi trình bày một thuật toán để tính toán hàm mục tiêu đề xuất thông qua phương pháp quy nạp ngược hoặc học tăng cường đa tác nhân.
Nó gợi ý khả năng thiết kế các hệ thống AI an toàn hơn so với việc tối đa hóa tiện ích trực tiếp.
Limitations:
Không có định nghĩa rõ ràng và thước đo khách quan để định lượng và đo lường 'sức mạnh con người'.
Không có lời giải thích cụ thể về cách thiết lập tham số và tối ưu hóa hàm mục tiêu đề xuất.
Thiếu sự kiểm chứng thực nghiệm về tính ứng dụng thực tế và hiệu quả của nó trong nhiều tình huống khác nhau.
Cần phải phân tích sâu hơn về định nghĩa cụ thể của tối đa hóa 'mềm' và tác động của nó.
Cần phải cân nhắc đầy đủ đến sự an toàn lâu dài và tính không thể đoán trước.
👍