When Engineering Outruns Intelligence: Rethinking Instruction-Guided Navigation
Created by
Haebom
저자
Matin Aghaei, Lingfeng Zhang, Mohammad Ali Alomrani, Mahdi Biparva, Yingxue Zhang
개요
본 논문은 최근 ObjectNav 시스템에서 대규모 언어 모델(LLM)이 얻은 제로샷 성능 향상에 대한 기여도를 언어와 기하학적 정보로 분리하여 재평가한다. 이를 위해 탐지기 제어 환경에서 InstructNav 파이프라인을 재평가하고, 액션 가치 맵만 변경하는 훈련 없는 두 가지 변형 모델 (기하학적 정보만 사용하는 Frontier Proximity Explorer (FPE)와 간단한 프론티어 투표를 통해 LLM을 사용하는 경량 Semantic-Heuristic Frontier (SHF))을 소개한다.
시사점, 한계점
•
시사점:
◦
정교하게 설계된 프론티어 기하학적 정보가 보고된 진전의 상당 부분을 차지한다.
◦
언어는 엔드 투 엔드 플래너보다 가벼운 휴리스틱으로서 더 신뢰할 수 있다.
◦
FPE는 탐지기 제어 명령어 추종자와 동등하거나 더 나은 성능을 보이면서 API 호출 없이 더 빠르게 실행된다.
◦
SHF는 더 작고 지역화된 언어 prior를 사용하여 비슷한 정확도를 달성한다.
•
한계점:
◦
논문에서 구체적인 한계점에 대한 언급은 없음. (해당 논문 요약에서 파악 가능한 내용은 아님)