Sign In

Autoregressive Action Sequence Learning for Robotic Manipulation

Created by
  • Haebom
Category
Empty

저자

Xinyu Zhang, Yuhan Liu, Haonan Chang, Liam Schramm, Abdeslam Boularias

개요

본 논문은 다양한 로봇과 작업 환경에서 우수한 성능을 발휘하는 범용 정책 아키텍처를 설계하는 문제를 다룹니다. 로봇 동작을 순차적 데이터로 표현하고, 자기회귀 순차 모델링을 통해 동작을 생성하는 방법을 제시합니다. 기존 자기회귀 아키텍처는 언어 모델링에서 단어 토큰으로 엔드 이펙터 경유지를 순차적으로 생성하는 방식으로, 저주파 제어 작업에 제한적입니다. 로봇 동작은 이질적이며 종종 관절 위치, 2D 픽셀 좌표, 엔드 이펙터 자세와 같은 연속적인 값을 포함하기 때문에 언어 기반 모델링에 적합하지 않습니다. 이러한 통찰력을 바탕으로, 본 논문은 청킹 자기회귀 변환기(CCT)를 통해 단일 단계에서 가변적인 수의 토큰을 예측하도록 단일 토큰 예측을 확장하는 간단한 개선을 제시합니다. 이 개선을 통해 다양한 제어 주파수의 다양한 작업에서 강력한 성능, 더 적은 자기회귀 단계를 통한 효율성 향상, 그리고 다양한 유형의 동작을 혼합하고 각 동작 유형에 대해 다른 청크 크기를 사용하는 하이브리드 동작 시퀀스 설계를 가능하게 합니다. CCT를 기반으로, 본 논문은 하이브리드 동작 시퀀스를 생성하여 조작 작업을 해결하는 자기회귀 정책(ARP) 아키텍처를 제안합니다. Push-T, ALOHA, RLBench를 포함한 다양한 로봇 조작 환경에서 ARP를 평가하고, ARP가 범용 아키텍처로서 모든 테스트 벤치마크에서 환경별 최첨단 성능과 동등하거나 우수하며, 계산 및 매개변수 크기 측면에서 더 효율적임을 보여줍니다.

시사점, 한계점

시사점:
다양한 로봇 및 작업 환경에서 우수한 성능을 보이는 범용 로봇 제어 아키텍처를 제시.
기존 언어 모델링 기반 방식의 한계를 극복하고, 다양한 유형의 연속적인 로봇 동작을 효과적으로 처리.
청킹 기법을 통해 계산 효율성 및 학습 효율 향상.
하이브리드 동작 시퀀스 생성을 통한 유연성 및 성능 향상.
다양한 벤치마크에서 기존 최고 성능과 비교하여 우수하거나 동등한 성능을 입증.
한계점:
본 논문에서 제시된 방법의 일반화 성능에 대한 추가적인 검증이 필요.
다양한 로봇 플랫폼 및 작업에 대한 적용성에 대한 더 넓은 범위의 실험이 필요.
복잡하고 예측 불가능한 환경에서의 성능 평가 필요.
실시간 제어 성능에 대한 자세한 분석 필요.
👍