Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation
Created by
Haebom
저자
Han Xue, Jieji Ren, Wendi Chen, Gu Zhang, Yuan Fang, Guoying Gu, Huazhe Xu, Cewu Lu
개요
본 논문은 시각 및 촉각 정보를 사용하여 복잡한 접촉 작업을 수행하는 인간의 능력을 모방하는 로봇 시스템 개발의 어려움을 다룹니다. 기존의 시각적 모방 학습(IL) 접근 방식은 행동을 청크화하여 복잡한 행동을 모델링하지만, 청크 실행 중 실시간 촉각 피드백에 즉각적으로 반응하는 능력이 부족합니다. 또한 대부분의 원격 조작 시스템은 미세한 촉각/힘 피드백을 제공하는 데 어려움을 겪어 수행 가능한 작업의 범위가 제한됩니다. 이러한 문제를 해결하기 위해, 본 논문에서는 증강 현실(AR)을 통해 실시간 촉각 피드백을 제공하는 저비용 원격 조작 시스템인 TactAR과, 접촉이 많은 조작 기술을 학습하기 위한 새로운 시각-촉각 모방 학습 알고리즘인 반응 확산 정책(RDP)을 제시합니다. RDP는 느린 잠재 확산 정책과 빠른 비대칭 토크나이저의 두 가지 수준의 계층 구조를 사용하여 복잡한 궤적 모델링과 빠른 반응 행동을 통합된 프레임워크 내에서 가능하게 합니다. 세 가지 복잡한 접촉 작업에 대한 광범위한 평가를 통해 RDP는 촉각/힘 피드백에 대한 빠른 반응을 통해 최첨단 시각적 IL 기준선에 비해 성능을 크게 향상시킵니다. 또한, 실험을 통해 RDP가 다양한 촉각/힘 센서에 적용될 수 있음을 보여줍니다.
시사점, 한계점
•
시사점:
◦
저비용의 증강현실 기반 원격 조작 시스템 TactAR을 통해 실시간 촉각 피드백 제공이 가능해짐.
◦
새로운 시각-촉각 모방 학습 알고리즘 RDP를 통해 복잡한 접촉 작업 수행 능력 향상.
◦
RDP의 이중 계층 구조(느린 잠재 확산 정책과 빠른 비대칭 토크나이저)를 통해 복잡한 궤적 모델링과 빠른 반응 행동을 동시에 달성.
◦
다양한 촉각/힘 센서에 적용 가능성을 확인.
•
한계점:
◦
TactAR 시스템의 저비용 및 실시간 피드백 제공의 구체적인 기술적 세부 사항이 부족.
◦
RDP 알고리즘의 일반화 성능 및 다양한 작업 환경에 대한 적용성에 대한 추가적인 검증 필요.