Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

MoMa-Kitchen: A 100K+ Benchmark for Affordance-Grounded Last-Mile Navigation in Mobile Manipulation

Created by
  • Haebom
Category
Empty

저자

Pingrui Zhang, Xianqiang Gao, Yuhan Wu, Kehui Liu, Dong Wang, Zhigang Wang, Bin Zhao, Yan Ding, Xuelong Li

개요

본 논문은 모바일 조작에서 탐색과 조작을 별개의 문제로 다루는 기존 방식의 한계를 극복하고자, 조작에 최적화된 위치로의 탐색을 학습하는 데 사용할 수 있는 대규모 데이터셋 MoMa-Kitchen을 제시합니다. MoMa-Kitchen은 다양한 주방 환경에서 수집된 10만 개 이상의 샘플을 포함하며, 로봇 팔의 시점에서 촬영된 RGB-D 데이터와 조작에 적합한 위치 정보(affordance label)를 제공합니다. 본 논문에서는 자동화된 파이프라인을 통해 다양한 실제 시나리오를 시뮬레이션하여 affordance label을 생성하고, 경량 기반 모델 NavAff를 개발하여 MoMa-Kitchen 데이터셋에서 성능을 검증합니다. NavAff는 로봇 팔 종류와 플랫폼 높이에 관계없이 최적의 조작 위치를 학습하여 탐색과 조작의 통합을 향상시킵니다.

시사점, 한계점

시사점:
모바일 조작에서 탐색과 조작의 원활한 통합을 위한 새로운 벤치마크 데이터셋 MoMa-Kitchen 제공.
다양한 로봇 팔과 플랫폼 높이에 적용 가능한 affordance 기반 최종 위치 지정 학습 가능성 제시.
NavAff 모델을 통해 affordance 기반 탐색의 실용성과 효과성 검증.
더욱 강력하고 일반화 가능한 임바디드 AI 시스템 개발에 기여.
한계점:
현재는 주방 환경에 국한된 데이터셋으로, 다른 환경으로의 일반화 성능은 추가 연구 필요.
NavAff 모델의 성능은 MoMa-Kitchen 데이터셋에 국한된 결과이며, 다른 데이터셋이나 실제 환경에서의 성능은 추가 검증 필요.
데이터셋 생성 과정의 자동화 파이프라인에 대한 자세한 설명 부족.
👍