每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

关于用扭曲噪声训练的视频扩散模型中的等方差和快速采样

Created by
  • Haebom

作者

刘超,阿拉什·瓦赫达特

大纲

本文对一种用于训练视频扩散模型的新技术——扭曲噪声(Warped Noise)进行了理论分析。将扭曲噪声与标准去噪目标相结合,表明该模型能够学习到与输入噪声的空间变换等变性。这种等变性(EquiVDM)能够自然地将生成视频的运动与输入噪声的运动对齐,无需特殊模块或辅助损失函数,从而获得一致且高保真的输出。此外,EquiVDM 仅需少量采样步骤即可实现卓越的质量,展现出卓越的采样效率。即使将其提炼为单步学生模型,EquiVDM 也能保持等变性,并且比各向异性基线模型提供更强大的运动控制和保真度。

Takeaways,Limitations

Takeaways:
EquiVDM 利用扭曲噪声技术,提高了视频生成模型的时间连贯性和视觉质量。
无需任何特殊的附加模块或损失即可创建高质量的视频。
高采样效率使您能够用更少的步骤获得良好的结果。
即使在精简模型中,各向同性也能得到维持,从而保持性能。
Limitations:
论文本身并未提出具体的 Limitations。
👍