Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

M3Bench: Benchmarking Whole-body Motion Generation for Mobile Manipulation in 3D Scenes

Created by
  • Haebom

저자

Zeyu Zhang, Sixu Yan, Muzhi Han, Zaijin Wang, Xinggang Wang, Song-Chun Zhu, Hangxin Liu

개요

M3Bench는 모바일 조작 작업에서 전신 동작 생성을 위한 새로운 벤치마크입니다. 3D 장면 맥락이 주어지면, M3Bench는 구현된 에이전트가 자신의 구성, 환경적 제약 및 작업 목표에 대해 추론하여 물체 재배치를 위한 조정된 전신 동작 궤적을 생성해야 합니다. M3Bench는 119개의 다양한 장면에 걸쳐 30,000개의 물체 재배치 작업을 제공하며, 기본적인 장면 및 로봇 정보만 사용하여 고수준 작업 지침으로부터 전신 동작 궤적을 생성하는 새롭게 개발된 자동 데이터 생성 도구인 M3BenchMaker를 통해 생성된 전문가 데모를 제공합니다. 본 벤치마크에는 다양한 차원에 걸쳐 일반화를 평가하기 위한 다양한 작업 분할이 포함되어 있으며, 궤적 평가를 위해 현실적인 물리 시뮬레이션을 활용합니다. 광범위한 평가 분석 결과, 최첨단 모델은 환경 및 작업별 제약을 준수하면서 베이스-암 동작을 조정하는 데 어려움을 겪는다는 것을 보여주며, 이러한 간극을 해소하기 위한 새로운 모델의 필요성을 강조합니다. M3Bench와 M3BenchMaker를 공개함으로써 다양하고 실제 환경에서 더욱 적응적이고 유능한 모바일 조작을 향한 로봇 공학 연구를 발전시키는 것을 목표로 합니다.

시사점, 한계점

시사점: 모바일 조작 작업에서 전신 동작 생성을 위한 새로운 벤치마크 M3Bench 제공. 자동 데이터 생성 도구 M3BenchMaker를 통해 다양한 작업과 장면을 포함하는 대규모 데이터셋 생성. 최첨단 모델의 한계를 드러내고 향후 연구 방향 제시. 실제 환경에서의 모바일 조작 기술 발전에 기여.
한계점: M3BenchMaker가 기본적인 장면 및 로봇 정보만 사용하므로, 복잡한 상황이나 예외적인 상황을 완벽하게 반영하지 못할 가능성. 현실적인 물리 시뮬레이션을 사용하지만, 실제 환경과의 완벽한 일치는 어려움. 최첨단 모델이 베이스-암 동작 조정 및 환경/작업 제약 준수에 어려움을 겪는다는 점에서, M3Bench 자체가 아직 해결되지 않은 문제점을 반영하고 있음.
👍