每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

基于矩和功率谱的文本到图像模型高斯正则化

Created by
  • Haebom

作者

黄志成、金在勋、成旼赫

大纲

本文提出了一种新颖的正则化损失函数,该损失函数能够促进与标准高斯分布的对齐,从而简化各种后续任务,包括文本转图像模型潜在空间的优化。我们将高维样本的元素视为空域中的一维标准高斯变量,并定义一个复合损失函数,该损失函数结合了空域中基于矩的正则化和谱域中基于功率谱的正则化。由于矩和功率谱分布的期望值是解析已知的,因此该损失函数能够促进与这些特征的对齐。为了确保置换不变性,该损失函数应用于随机置换的输入。值得注意的是,现有的基于高斯分布的正则化函数已被集成到我们的统一框架中。其中一些对应于特定阶的矩损失函数,而之前的协方差匹配损失函数虽然与我们的谱损失函数等效,但由于空域计算而导致时间复杂度更高。本文展示了正则化函数在文本转图像模型的生成模型中测试时补偿对齐中的应用,具体而言,它能够提升文本的美观度和文本对齐效果。所提出的正则化优于以前的高斯正则化,有效地防止了补偿黑客攻击,并加快了收敛速度。

Takeaways, Limitations

Takeaways:
一种新颖的正则化损失提议,鼓励与标准高斯分布保持一致。
提供一个集成现有基于高斯的正则化方法的统一框架。
提出了一种有效的规范化方法来提高文本到图像模型的美观性和文本对齐性。
防止补偿黑客攻击并提高收敛速度。
Limitations:
可能需要对所提出的正则化损失进行额外的一般性能评估。
各种文本到图像模型和应用需要进行广泛的实验评估。
它有可能对于某些类型的数据或模型来说过于专业化。
👍