每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

WorldForge:通过免训练指导解锁视频传播模型中的新兴 3D/4D 生成

Created by
  • Haebom

作者

宋晨曦、杨彦明、赵通、李瑞波、张驰

大纲

为了解决视频扩散模型的局限性,本文提出了 WorldForge 框架,该框架无需训练即可在推理阶段应用。WorldForge 由三个模块组成,并注入了精确的轨迹引导,从而实现精准的运动控制和逼真的内容生成。该框架可应用于各种 3D/4D 任务,并且在轨迹一致性、几何一致性和感知质量方面均优于现有方法。

Takeaways, Limitations

Takeaways:
我们提出了一个框架,可以在推理时实现轨迹引导,而无需训练。
实现精确的运动控制和逼真的内容创作。
广泛适用于3D/4D工作,即插即用,适用于各种型号。
在轨迹合规性、几何一致性和感知质量方面比现有方法取得了更优异的性能。
Limitations:
论文中没有具体提及Limitations(无法仅根据摘要确定)。
👍