MoMa-Kitchen: A 100K+ Benchmark for Affordance-Grounded Last-Mile Navigation in Mobile Manipulation
Created by
Haebom
Category
Empty
저자
Pingrui Zhang, Xianqiang Gao, Yuhan Wu, Kehui Liu, Dong Wang, Zhigang Wang, Bin Zhao, Yan Ding, Xuelong Li
개요
본 논문은 모바일 조작에서 탐색과 조작을 별개의 문제로 다루는 기존 방식의 한계를 극복하고자, 조작에 최적화된 위치로의 탐색을 학습하는 데 사용할 수 있는 대규모 데이터셋 MoMa-Kitchen을 제시합니다. MoMa-Kitchen은 다양한 주방 환경에서 수집된 10만 개 이상의 샘플을 포함하며, 로봇 팔의 시점에서 촬영된 RGB-D 데이터와 조작에 적합한 위치 정보(affordance label)를 제공합니다. 본 논문에서는 자동화된 파이프라인을 통해 다양한 실제 시나리오를 시뮬레이션하여 affordance label을 생성하고, 경량 기반 모델 NavAff를 개발하여 MoMa-Kitchen 데이터셋에서 성능을 검증합니다. NavAff는 로봇 팔 종류와 플랫폼 높이에 관계없이 최적의 조작 위치를 학습하여 탐색과 조작의 통합을 향상시킵니다.
시사점, 한계점
•
시사점:
◦
모바일 조작에서 탐색과 조작의 원활한 통합을 위한 새로운 벤치마크 데이터셋 MoMa-Kitchen 제공.
◦
다양한 로봇 팔과 플랫폼 높이에 적용 가능한 affordance 기반 최종 위치 지정 학습 가능성 제시.
◦
NavAff 모델을 통해 affordance 기반 탐색의 실용성과 효과성 검증.
◦
더욱 강력하고 일반화 가능한 임바디드 AI 시스템 개발에 기여.
•
한계점:
◦
현재는 주방 환경에 국한된 데이터셋으로, 다른 환경으로의 일반화 성능은 추가 연구 필요.
◦
NavAff 모델의 성능은 MoMa-Kitchen 데이터셋에 국한된 결과이며, 다른 데이터셋이나 실제 환경에서의 성능은 추가 검증 필요.