本文探讨了传统人工智能的感知如何依赖于基于状态的表征学习,而规划则通过探索实现。我们探索推理能否从同时捕捉感知和时间结构的表征中产生。我们表明,标准的时间对比学习往往依赖于错误的特征,无法捕捉时间结构。为了解决这个问题,我们引入了时间推理的组合表征 (CRTR),它使用负采样方法去除虚假特征并促进时间推理。CRTR 在具有复杂时间结构的领域(例如推箱子和魔方)取得了稳健的结果。具体而言,对于魔方,CRTR 学习了可泛化至所有初始状态的表征,并且能够比 BestFS 用更少的探索步骤解题(同时产生更长的解)。这代表了第一种仅使用学习到的表征即可高效求解任意魔方状态的方法,无需依赖外部搜索算法。