Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Học tập trải nghiệm dựa trên Kolb dành cho các tác nhân tổng quát với hiệu suất khoa học dữ liệu Kaggle ở ​​cấp độ con người

Created by
  • Haebom

Tác giả

Antoine Grosnit, Alexandre Maraval, Refinath SN, Zichao Zhao, James Dora, Giuseppe Paolo, Albert Thomas, Jonas Gonzalez, Abhineet Kumar, Khyati Khandelwal, Abdelhakim Benechehab, Hamza Cherkaoui, Youssef Attia El-Hili, Kun Shao, Jianye Hao, Jun Yao, Balazs K egl, Jun Wang

Phác thảo

Bài báo này đề xuất một khuôn khổ tính toán dựa trên học tập trải nghiệm của Kolb và lý thuyết phát triển vùng gần nhất của Vygotsky, nhấn mạnh rằng chuyên môn của con người phát triển thông qua tương tác lặp đi lặp lại, phản ánh và cập nhật mô hình nội bộ. Để khắc phục những hạn chế của tiền huấn luyện tĩnh và quy trình làm việc cứng nhắc của các tác nhân LLM hiện có, chúng tôi thiết kế một kiến ​​trúc tách biệt tương tác với môi trường (các chức năng bên ngoài) khỏi phản ánh/trừu tượng hóa bên trong (các chức năng bên trong). Điều này cho phép học tập có khung dựa trên nhận thức, cho phép khái quát hóa mở sau khi học trong một môi trường có cấu trúc. Trong một cuộc thi khoa học dữ liệu Kaggle thực tế, nơi khả năng tạo mã khoa học dữ liệu tự động được đánh giá trên 81 nhiệm vụ, Agent K đã đạt được số điểm là 1694, vượt qua điểm Elo-MMR trung bình của Kaggle Masters (2% cao nhất) và giành được nhiều huy chương. Đây là hệ thống AI đầu tiên tích hợp thành công các lý thuyết học tập nhận thức của Kolb và Vygotsky, thể hiện một bước tiến đáng kể hướng tới AI đa năng.

Takeaways, Limitations

Takeaways:
Một khuôn khổ học tập tác nhân LLM mới dựa trên lý thuyết học tập theo kinh nghiệm của Kolb và lý thuyết phát triển vùng gần nhất của Vygotsky được trình bày.
ĐặC vụ K chứng minh tiềm năng phát triển các hệ thống AI có khả năng giải quyết các nhiệm vụ phức tạp ở cấp độ con người.
Xác minh hiệu suất thông qua kết quả thử nghiệm sử dụng dữ liệu thực tế từ các cuộc thi Kaggle.
Trình bày hướng đi mới cho sự phát triển của AI đa năng.
Limitations:
Hiệu suất của tác nhân K có thể bị giới hạn trong một lĩnh vực cụ thể (khoa học dữ liệu).
Cần nghiên cứu thêm để xác định khả năng khái quát hóa của khuôn khổ đề xuất.
Khả năng không thể mô phỏng hoàn hảo các quá trình nhận thức của con người
Cần thảo luận thêm về những tác động về mặt đạo đức và xã hội.
👍