Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Mind the Gap: Sự khác biệt giữa các nhiệm vụ do con người và LLM tạo ra

Created by
  • Haebom

Tác giả

Yi-Long Lu, Jiajun Song, Chunhui Zhang, Wei Wang

Phác thảo

Bài báo này đã tiến hành các thí nghiệm tạo nhiệm vụ với con người và GPT-4o để điều tra xem các tác nhân tạo ra dựa trên các mô hình ngôn ngữ quy mô lớn (LLM) có tạo ra các nhiệm vụ theo cách giống con người hay không. Kết quả của chúng tôi cho thấy rằng trong khi việc tạo ra nhiệm vụ của con người luôn bị ảnh hưởng bởi các giá trị cá nhân như sự cởi mở với trải nghiệm và các động lực tâm lý như phong cách nhận thức, thì LLM không phản ánh các kiểu hành vi này ngay cả khi được cung cấp rõ ràng các động lực tâm lý. Các nhiệm vụ do LLM tạo ra ít mang tính xã hội hơn, ít đòi hỏi thể chất hơn và tập trung nhiều hơn vào các chủ đề trừu tượng. Mặc dù các nhiệm vụ do LLM tạo ra được đánh giá là hấp dẫn và mới lạ hơn, điều này cho thấy khoảng cách giữa khả năng ngôn ngữ của LLM và khả năng tạo ra các mục tiêu cụ thể, giống con người của họ. Tóm lại, có một sự khác biệt cơ bản giữa bản chất cụ thể và hướng đến giá trị của nhận thức con người và các kiểu thống kê của LLM. Việc thiết kế các tác nhân lấy con người làm trung tâm hơn đòi hỏi phải tích hợp động lực nội tại và nền tảng vật lý.

Takeaways, Limitations

Takeaways:
Chúng tôi nhận thấy rằng quá trình sáng tạo của con người chịu ảnh hưởng đáng kể bởi các giá trị cá nhân và phong cách nhận thức.
Không giống như con người, LLM không có tính xã hội, ít hoạt động thể chất và có xu hướng thực hiện các nhiệm vụ trừu tượng.
Có một khoảng cách giữa khả năng ngôn ngữ của LLM và khả năng tạo ra mục tiêu giống con người.
Việc tích hợp động lực nội tại và nền tảng vật lý là điều cần thiết để phát triển các tác nhân lấy con người làm trung tâm.
Limitations:
Các thí nghiệm GPT-4o được tiến hành chỉ sử dụng một LLM, điều này hạn chế khả năng khái quát hóa.
Có thể hiệu quả của chương trình LLM không được đánh giá đúng mức do những hạn chế trong cách cung cấp động lực tâm lý cho chương trình LLM.
Cần phải xem xét thêm độ tin cậy của kết quả vì không có đủ thông tin về số lượng và tính đa dạng của những người tham gia nghiên cứu.
👍