Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Cơ sở tính toán của việc ra quyết định của LLM trong mô phỏng xã hội

Created by
  • Haebom

Tác giả

Kỷ Mã

Phác thảo

Bài báo này khám phá ảnh hưởng của tính cách và bối cảnh lên hành vi của các mô hình ngôn ngữ quy mô lớn (LLM), được sử dụng như các tác nhân ra quyết định giống con người trong khoa học xã hội và các lĩnh vực ứng dụng. Cụ thể, chúng tôi đề xuất và xác thực một phương pháp để kiểm tra, định lượng và sửa đổi các biểu diễn nội tại của LLM bằng cách sử dụng Trò chơi Độc tài, một thí nghiệm hành vi kinh điển kiểm tra sự công bằng và hành vi ủng hộ xã hội. Chúng tôi chứng minh rằng việc trích xuất "các vectơ thay đổi biến" (ví dụ: từ "nam" sang "nữ") từ trạng thái nội tại của LLM và thao tác các vectơ này trong quá trình suy luận có thể thay đổi đáng kể cách các biến liên quan đến các quyết định của mô hình. Cách tiếp cận này cung cấp một phương pháp có nguyên tắc để nghiên cứu và điều chỉnh cách các khái niệm xã hội có thể được mã hóa và thiết kế trong các mô hình dựa trên Transformer, và trình bày Takeaways cho việc căn chỉnh, loại bỏ sai lệch và thiết kế các tác nhân AI cho mô phỏng xã hội trong các ứng dụng học thuật và thương mại. Điều này có thể góp phần nâng cao lý thuyết và phép đo xã hội học.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một phương pháp mới để phân tích ảnh hưởng của các khái niệm xã hội đến quá trình ra quyết định của mô hình bằng cách kiểm tra và thao tác các biểu diễn nội bộ của LLM.
Cung cấp các chiến lược thực tế để loại bỏ định kiến ​​và thiết kế chương trình LLM một cách có đạo đức.
Trình bày phương pháp mới để mô phỏng xã hội và phát triển tác nhân AI.
Góp phần thúc đẩy lý thuyết xã hội học và phương pháp đo lường.
Limitations:
Những kết quả nghiên cứu này chỉ giới hạn trong một môi trường thử nghiệm cụ thể, Trò chơi Độc tài. Cần nghiên cứu thêm để xác định liệu có thể đạt được kết quả tương tự trong các môi trường hoặc tình huống thử nghiệm khác hay không.
Cần có thêm sự xác nhận về tính tổng quát và khả năng áp dụng của việc trích xuất và thao tác "các vectơ thay đổi biến đổi".
Có khả năng là tính phức tạp của các biểu diễn nội bộ LLM có thể không được nắm bắt đầy đủ.
Thiếu sự cân nhắc đến các yếu tố khác ảnh hưởng đến việc ra quyết định của mô hình.
👍