Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ManiCM: Real-time 3D Diffusion Policy via Consistency Model for Robotic Manipulation

Created by
  • Haebom

저자

Guanxing Lu, Zifeng Gao, Tianxing Chen, Wenxun Dai, Ziwei Wang, Wenbo Ding, Yansong Tang

개요

본 논문에서는 고차원 관측치에서 다중 탈잡음 단계로 인해 심각한 실행 시간 비효율성을 겪는 기존 확산 모델 기반 3D 로봇 조작 방법의 문제점을 해결하기 위해, 일단계 추론으로 로봇 동작을 생성하는 실시간 로봇 조작 모델인 ManiCM을 제안합니다. ManiCM은 확산 과정에 일관성 제약 조건을 부과하여, 점 구름 입력을 조건으로 로봇 동작 공간에서 일관된 확산 과정을 공식화합니다. 이는 ODE 궤적 상의 어떤 점에서도 원래 동작을 직접 탈잡음 처리해야 함을 의미합니다. 이 과정을 모델링하기 위해, 저차원 동작 매니폴드에서 빠른 수렴을 위해 비전 분야에서의 노이즈 예측 대신 동작 샘플을 직접 예측하는 일관성 증류 기술을 설계했습니다. Adroit 및 Metaworld의 31가지 로봇 조작 작업에 대한 평가 결과, 제안된 방법이 최첨단 방법보다 평균 추론 속도가 10배 빨라지면서 경쟁력 있는 평균 성공률을 유지함을 보여줍니다.

시사점, 한계점

시사점:
일단계 추론을 통해 기존 확산 모델 기반 로봇 조작 방법의 실행 시간 비효율성 문제를 효과적으로 해결했습니다.
일관성 증류 기술을 통해 저차원 동작 매니폴드에서 빠른 수렴을 달성했습니다.
다양한 로봇 조작 작업에서 최첨단 성능을 유지하면서 10배 향상된 추론 속도를 달성했습니다.
한계점:
제안된 방법의 일반성 및 다양한 로봇 플랫폼에 대한 적용 가능성에 대한 추가적인 연구가 필요합니다.
일관성 제약 조건의 강도 및 파라미터 최적화에 대한 추가적인 분석이 필요할 수 있습니다.
복잡한 환경이나 장애물이 있는 상황에서의 성능 평가가 추가적으로 필요합니다.
👍