본 논문은 기존 시각적 내비게이션 설정에서 간과되어 온 평면도 정보를 활용하여 효율성과 정확성을 높이는 새로운 내비게이션 과제인 Floor Plan Visual Navigation (FloNa)을 제시합니다. FloNa는 평면도와 실제 장면 레이아웃 간의 공간적 불일치 처리 및 서로 다른 모달리티의 관찰 이미지와 평면도 스케치 정렬이라는 두 가지 주요 과제를 다룹니다. 이를 해결하기 위해, 현재 관찰과 평면도 간의 정렬을 용이하게 하는 위치 파악 모듈을 통합한 새로운 확산 정책 프레임워크인 FloDiff를 제안합니다. iGibson 시뮬레이터에서 117개의 장면에 걸쳐 2만 개의 내비게이션 에피소드를 수집하여 학습 및 평가를 지원합니다. 광범위한 실험을 통해 생소한 장면에서 평면도 지식을 사용하는 프레임워크의 효과와 효율성을 입증합니다.
시사점, 한계점
•
시사점:
◦
평면도 정보를 활용한 새로운 시각적 내비게이션 과제(FloNa) 제시 및 해결 방안 제시.
◦
FloDiff라는 효과적이고 효율적인 확산 정책 프레임워크 개발.
◦
평면도와 실제 장면 간의 불일치 문제 및 모달리티 차이 문제 해결에 대한 새로운 접근법 제시.
◦
iGibson 시뮬레이터를 이용한 대규모 데이터셋 구축.
•
한계점:
◦
현재는 iGibson 시뮬레이터 환경에서만 평가되었으므로, 실제 세계 환경에서의 성능은 추가적인 검증이 필요.