每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

时间推理的对比表征

Created by
  • Haebom

作者

阿莉恰·齐亚科、米哈尔·博尔特凯维奇、米哈尔·扎瓦尔斯基、本杰明·艾森巴赫、彼得·米洛斯

大纲

本文探讨了传统人工智能的感知如何依赖于基于状态的表征学习,而规划则通过探索实现。我们探索推理能否从同时捕捉感知和时间结构的表征中产生。我们表明,标准的时间对比学习往往依赖于错误的特征,无法捕捉时间结构。为了解决这个问题,我们引入了时间推理的组合表征 (CRTR),它使用负采样方法去除虚假特征并促进时间推理。CRTR 在具有复杂时间结构的领域(例如推箱子和魔方)取得了稳健的结果。具体而言,对于魔方,CRTR 学习了可泛化至所有初始状态的表征,并且能够比 BestFS 用更少的探索步骤解题(同时产生更长的解)。这代表了第一种仅使用学习到的表征即可高效求解任意魔方状态的方法,无需依赖外部搜索算法。

Takeaways,Limitations

Takeaways:
CRTR 通过学习捕捉时间结构的表示成功解决了复杂的时间推理问题。
它为魔方等难题提供了有效的解决方案,并且比现有方法使用了更少的搜索步骤。
这是第一种仅使用学习表示来解决问题的方法,无需任何外部搜索算法。
CRTR 学习可应用于各种初始状态的广义表示。
Limitations:
与现有方法相比,解决方案的长度更长。
这篇论文的具体Limitations应该在论文中进一步研究。(单独提供的信息不能用于确定这一点。)
👍