[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Căn chỉnh con người và robot thông qua học tăng cường từ phản hồi ngầm của con người

Created by
  • Haebom

Tác giả

Suzie Kim, Hye-Bin Shin, Seong-Whan Lee

Phác thảo

Trong bài báo này, chúng tôi đề xuất một khuôn khổ học tăng cường dựa trên phản hồi của con người ngầm (RLIHF) sử dụng điện não đồ (EEG) để khắc phục những hạn chế của học tăng cường (RL) thông thường, vốn gặp khó khăn trong việc học các chính sách hiệu quả trong môi trường phần thưởng thưa thớt. Chúng tôi sử dụng các tiềm năng liên quan đến lỗi (ErrP) để cung cấp phản hồi ngầm liên tục mà không cần sự can thiệp rõ ràng của người dùng và chuyển đổi các tín hiệu EEG thô thành các thành phần phần thưởng xác suất thông qua bộ giải mã được đào tạo trước để cho phép học chính sách hiệu quả ngay cả trong môi trường phần thưởng bên ngoài thưa thớt. Chúng tôi đánh giá phương pháp được đề xuất về các nhiệm vụ tránh chướng ngại vật và thao tác đối tượng bằng cánh tay rô-bốt Kinova Gen2 trong môi trường mô phỏng dựa trên công cụ vật lý MuJoCo. Chúng tôi chứng minh rằng tác nhân được đào tạo với phản hồi EEG được giải mã đạt được hiệu suất tương đương với tác nhân được đào tạo với phần thưởng dày đặc được thiết kế thủ công. Điều này chứng minh tiềm năng của việc tận dụng phản hồi thần kinh ngầm cho việc học tăng cường có thể mở rộng và lấy con người làm trung tâm trong robot tương tác.

Takeaways, Limitations

Takeaways:
Một khuôn khổ RLHF mới để giải quyết vấn đề phần thưởng khan hiếm được trình bày.
Cho phép tương tác tự nhiên bằng cách tận dụng phản hồi ngầm mà không cần sự can thiệp rõ ràng của người dùng
ĐạT được hiệu quả học tập chính sách thông qua phản hồi ngầm dựa trên EEG
Trình bày tiềm năng của việc học tăng cường có thể mở rộng và lấy con người làm trung tâm trong lĩnh vực robot tương tác
Limitations:
Hiện tại chỉ được đánh giá trong môi trường mô phỏng, cần phải xác minh hiệu suất trong môi trường robot thực tế.
Cần nghiên cứu thêm về độ chính xác và hiệu suất tổng quát của việc giải thích tín hiệu EEG
Cần đánh giá hiệu suất tổng quát cho các nhiệm vụ và người dùng khác nhau
Cần phải cân nhắc đến tính phức tạp và chi phí của việc thu thập và xử lý dữ liệu EEG.
👍