本文重点探讨了现有空间推理的局限性,即未能考虑物体朝向,而物体朝向是六自由度微操作的关键因素。现有的姿态表征方法依赖于预定义的框架或模板,限制了泛化能力和语义基础。为了解决这个问题,我们提出了“语义朝向”的概念,它使用自然语言定义物体朝向,而无需参考框架(例如,USB 的“插入式”朝向、杯子的“手柄式”朝向)。我们构建了一个大规模的语义朝向 3D 物体数据集 OrienText300K,并开发了一个用于零样本语义朝向预测的通用模型 PointSO。我们提出了 SoFar 框架,该框架将语义朝向集成到 VLM 代理中,以实现六自由度空间推理并生成机器人运动。实验结果证明了 SoFar 的有效性和泛化能力,在 Open6DOR 上实现了 48.7% 的零样本成功率,在 SIMPLER-Env 上实现了 74.9% 的零样本成功率。