Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

CogDDN: A Cognitive Demand-Driven Navigation with Decision Optimization and Dual-Process Thinking

Created by
  • Haebom

저자

Yuehao Huang, Liang Liu, Shuangming Lei, Yukai Ma, Hao Su, Jianbiao Mei, Pengxiang Zhao, Yaqing Gu, Yong Liu, Jiajun Lv

개요

본 논문은 알려지지 않은 비정형 환경에서 인간의 요구를 충족하기 위해 이동 로봇의 탐색 및 상호 작용 능력 향상에 초점을 맞추고 있습니다. 기존의 데이터 기반 수요 주도 탐색(DDN) 방법의 일반화능력 한계를 극복하고자, 인간의 인지 및 학습 메커니즘을 모방한 VLM 기반 프레임워크인 CogDDN을 제안합니다. CogDDN은 빠른 사고 시스템과 느린 사고 시스템을 통합하고, 사용자 요구 충족에 필수적인 주요 개체를 선택적으로 식별하여 적절한 목표 개체를 식별합니다. 휴리스틱 프로세스와 분석 프로세스로 구성된 이중 프로세스 의사결정 모듈을 통해 효율적인 의사결정과 과거 오류 분석 및 지식 기반 축적을 통한 성능 향상을 실현합니다. 또한, Chain of Thought (CoT) 추론을 통해 의사결정 프로세스를 강화합니다. AI2Thor 시뮬레이터와 ProcThor 데이터셋을 사용한 실험 결과, CogDDN이 기존 단일 카메라 방식보다 15% 향상된 탐색 정확도와 적응력을 보임을 확인했습니다.

시사점, 한계점

시사점:
인간의 인지적 과정을 모방한 VLM 기반 DDN 프레임워크인 CogDDN을 제시하여 기존 DDN 방식의 한계를 극복.
빠른 사고와 느린 사고 시스템 통합 및 CoT 추론을 통해 의사결정 정확도 향상.
AI2Thor 시뮬레이터 실험을 통해 기존 방식 대비 15%의 성능 향상을 검증.
실제 로봇 탐색 및 상호작용 기술 발전에 기여.
한계점:
AI2Thor 시뮬레이터 기반 실험 결과로, 실제 환경 적용 시 성능 저하 가능성 존재.
ProcThor 데이터셋 의존성으로 데이터셋의 편향이 결과에 영향을 미칠 수 있음.
다양한 환경 및 작업에 대한 일반화 성능 추가 검증 필요.
휴리스틱 프로세스와 분석 프로세스 간의 상호작용 및 조정 메커니즘에 대한 자세한 설명 부족.
👍