Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

DORAEMON: Decentralized Ontology-aware Reliable Agent with Enhanced Memory Oriented Navigation

Created by
  • Haebom

作者

Tianjun Gu, Linfeng Li, Xuhong Wang, Chenghua Gong, Jingyu Gong, Zhizhong Zhang, Yuan Xie, Lizhuang Ma, Xin Tan

概要

DORAEMONは、視覚言語モデル(VLM)ベースのゼロショット自律航海の限界を克服するために開発された認知ベースのフレームワークです。 DORAEMONは、人間の航海能力を模倣するVentralとDorsal Streamsで構成されており、階層的意味-空間融合、トポロジーマップ、RAG-VLM、ポリシー-VLMを統合し、時空間不連続性、非構造的メモリ表現、不十分な作業理解の問題を解決します。また、Nav-Ensuranceを通じて航海の安全性と効率性を保証します。 DORAEMONはHM3D、MP3D、GOATデータセットで最先端のパフォーマンスを達成し、新しい評価指標であるAORIを導入して航海知能をよりよく評価します。

Takeaways、Limitations

Takeaways:
事前マップの構築や事前訓練なしにゼロショット自律航海でステート・オブ・ザ・アート性能を達成。
HM3D、MP3D、GOATデータセットの成功率(SR)とパスの長さによる成功の重み(SPL)メトリックで、従来の方法より優れたパフォーマンス。
航海知能をよりよく評価するための新しい評価指標(AORI)の導入。
VentralとDorsal Streamsを活用して、人間の航海能力を模倣した新しいフレームワークの提示。
Limitations:
論文に具体的なLimitationsへの言及はありません。
👍