M2R2: MultiModal Robotic Representation for Temporal Action Segmentation
Created by
Haebom
Category
Empty
저자
Daniel Sliwowski, Dongheui Lee
개요
M2R2는 로봇 공학 및 컴퓨터 비전 분야의 핵심 연구 분야인 시계열 동작 분할(TAS)을 위한 멀티모달 특징 추출기입니다. 자체 수용성 및 외부 수용성 센서 정보를 결합하여 TAS를 수행하며, 여러 TAS 모델에서 학습된 특징을 재사용할 수 있는 새로운 사전 훈련 전략을 제안합니다. REASSEMBLE 데이터셋에서 기존 로봇 동작 분할 모델보다 46.6% 향상된 최첨단 성능을 달성했습니다.