Runyu Jiao, Matteo Bortolon, Francesco Giuliari, Alice Fasoli, Sergio Povoli, Guofeng Mei, Yiming Wang, Fabio Poiesi
개요
UNOGrasp는 혼잡한 환경에서 시각적으로 대상 물체를 찾고, 방해물을 제거하는 과정을 추론하여 물체를 잡는 로봇 그리핑을 위한 비전-언어 모델입니다. 이 모델은 방해 경로를 기반으로 하는 다단계 추론 프로세스를 사용하며, 방해물 인식 시각적 단서를 통해 각 추론 단계를 고정합니다. UNOGrasp는 지도 학습과 강화 학습을 결합하여 훈련되며, UNOBench라는 대규모 데이터세트를 사용하여 훈련 및 평가됩니다.
시사점, 한계점
•
혼잡한 환경에서 로봇 그리핑을 위한 방해물 추론 및 접근성 계획 능력을 향상시켰습니다.
•
UNOGrasp는 합성 및 실제 환경 모두에서 일반적인 모델 및 독점 모델보다 뛰어난 성능을 보였습니다.