每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

AirScape:具有运动可控性的空中生成世界模型

Created by
  • Haebom

作者

赵百宁、唐荣泽、贾明远、王子友、满方航、张欣、尚宇、张伟辰、吴伟、高晨、陈新雷、李勇

大纲

AirScape 是首个旨在帮助智能体预测自身在 3D 空间中运动意图的世界模型。它能够根据当前的视觉输入和运动意图预测未来的观察序列。我们利用包含 11,000 个视频-意图对的无人机运动数据集,对各种场景中无人机的第一人称视角视频和运动意图进行了注释。AirScape 为基线模型制定了两步训练计划,从而构建了一个可由运动意图控制并遵循物理时空约束的世界模型。实验结果表明,AirScape 在 3D 空间图像方面的表现显著优于现有的基线模型,运动对齐指标提升了 50% 以上。

Takeaways, Limitations

Takeaways:
为3D空间想象呈现一个新的世界模型。
构建无人机运动数据集。
开发可由运动意图控制的世界模型。
与现有模型相比,提高了 3D 空间想象性能。
Limitations:
论文中没有指定 Limitations。
👍