Kaiyuan Chen, Letian Fu, David Huang, Yanxiang Zhang, Lawrence Yunliang Chen, Huang Huang, Kush Hari, Ashwin Balakrishna, Ted Xiao, Pannag R Sanketi, John Kubiatowicz, Ken Goldberg
개요
본 논문은 다양한 모달리티(비디오, 텍스트, 숫자)의 로봇 궤적 데이터를 효율적으로 관리, 공유 및 학습하기 위한 클라우드 기반 오픈소스 데이터 관리 도구인 Robo-DM을 제안합니다. Robo-DM은 EBML(Extensible Binary Meta Language)을 사용하여 로봇 데이터를 자체 포함 형식으로 저장하며, 기존 방식 대비 최대 70배(손실 압축) 및 3.5배(무손실 압축)의 공간 절약 효과를 제공합니다. 또한 메모리 매핑 디코딩 캐시를 이용한 비디오 디코딩 로드 밸런싱을 통해 데이터 검색 속도를 향상시키며, 기존 방식 대비 최대 50배 빠른 디코딩 속도를 보입니다. 손실 압축을 사용하여 훈련된 모델의 물리적 평가 결과, 원본 데이터셋의 75배 압축에도 불구하고 작업 정확도 저하 없이 픽앤플레이스 작업을 성공적으로 수행했습니다.
시사점, 한계점
•
시사점:
◦
대규모 로봇 데이터셋 관리 및 활용의 효율성을 크게 향상시키는 오픈소스 도구 제공.
◦
EBML 기반의 효율적인 데이터 저장 및 압축 기술 제시 (최대 70배의 공간 절약).
◦
메모리 매핑 디코딩 캐시를 활용한 빠른 데이터 검색 및 디코딩 (최대 50배 속도 향상).
◦
손실 압축에도 불구하고 downstream task 정확도 저하 없음을 실험적으로 증명.
•
한계점:
◦
현재 제시된 실험은 특정 작업(픽앤플레이스)과 모델(In-Context Robot Transformer)에 한정됨. 다양한 작업 및 모델에 대한 일반화 성능 검증이 추가적으로 필요.