Ziluo Ding, Haobin Jiang, Yuxuan Wang, Zhenguo Sun, Yu Zhang, Xiaojie Niu, Ming Yang, Weishuai Zeng, Xinrun Xu, Zongqing Lu
개요
JAEGER는 인간형 로봇을 위한 이중 레벨 전신 제어기로, 더욱 견고하고 다재다능한 정책을 훈련하는 과제를 해결합니다. 기존의 단일 제어기 방식과 달리, 상체와 하체의 제어를 두 개의 독립적인 제어기로 분리하여 각기 다른 작업에 더욱 집중할 수 있도록 합니다. 이러한 분리는 차원의 저주를 완화하고 내결함성을 향상시킵니다. JAEGER는 루트 속도 추적(거친 제어)과 국소 관절 각도 추적(미세 제어)을 모두 지원하여 다재다능하고 안정적인 움직임을 가능하게 합니다. 제어기를 훈련하기 위해 인간 모션 데이터셋(AMASS)을 사용하고, 효율적인 재타겟팅 네트워크를 통해 인간 자세를 인간형 자세로 재타겟팅하며, 커리큘럼 학습 방식을 적용합니다. 이 방법은 초기화를 위한 지도 학습과 추가 탐색을 위한 강화 학습을 수행합니다. 두 개의 인간형 플랫폼에서 실험을 수행하여 시뮬레이션 및 실제 환경 모두에서 최첨단 방법에 비해 우리 접근 방식의 우수성을 보여줍니다.
시사점, 한계점
•
시사점:
◦
상체와 하체 제어 분리로 인한 차원의 저주 완화 및 내결함성 향상.
◦
루트 속도 추적과 국소 관절 각도 추적을 통한 다재다능하고 안정적인 움직임 구현.
◦
커리큘럼 학습 방식을 통한 효율적인 제어기 훈련.
◦
시뮬레이션 및 실제 환경에서 최첨단 방법 대비 우수한 성능 입증.
•
한계점:
◦
AMASS 데이터셋 의존성. 다양한 데이터셋에 대한 일반화 성능 검증 필요.
◦
효율적인 재타겟팅 네트워크의 구체적인 설계 및 성능에 대한 자세한 설명 부족.
◦
실제 환경 적용 시 발생 가능한 예측하지 못한 상황에 대한 robustness 검증 추가 필요.