FreqPolicy: Frequency Autoregressive Visuomotor Policy with Continuous Tokens
Created by
Haebom
저자
Yiming Zhong, Yumeng Liu, Chuyang Xiao, Zemin Yang, Youzhuo Wang, Yufei Zhu, Ye Shi, Yujing Sun, Xinge Zhu, Yuexin Ma
개요
본 논문은 로봇 조작을 위한 효과적인 시각 운동 정책 학습의 어려움을 해결하기 위해 주파수 영역에서 동작을 표현하는 새로운 패러다임을 제시합니다. 기존 방법들의 한계인 동작 표현 및 네트워크 구조의 문제점을 지적하며, 저주파 성분은 전반적인 움직임 패턴을, 고주파 성분은 미세한 부분을 효과적으로 포착하는 주파수 영역 표현의 장점을 활용합니다. 계층적 주파수 성분을 점진적으로 모델링하고, 연속적인 잠재 표현을 도입하여 동작 공간의 부드러움과 연속성을 유지함으로써 정확성을 높였습니다. 다양한 2D 및 3D 로봇 조작 벤치마크 실험을 통해 기존 방법보다 정확성과 효율성 모두에서 우수한 성능을 보임을 확인했습니다.