每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

综合历史:评估扩散模型中过去的视觉表征

Created by
  • Haebom

作者

玛丽亚-特蕾莎·德·罗莎·帕尔米尼,伊娃·塞蒂尼奇

大纲

本文提出了一个用于评估文本转图像 (TTI) 传播模型历史语境化能力的基准。我们使用 HistVis 数据集,评估 TTI 模型在隐含风格关联、历史一致性和人口统计表征方面如何表征特定时代。结果表明,TTI 模型在描述历史主题时存在系统性误差,过度使用某些风格,包含不合时宜的元素,并且未能反映现实的人口统计模式。

Takeaways,Limitations

Takeaways:
提供可重复的基准来评估 TTI 模型的历史表示准确性。
我们具体指出了TTI模型描述历史主题时出现的问题并提出了改进方法。
它强调了开发考虑历史背景的 TTI 模型的重要性。
Limitations:
仅限于对三个特定 TTI 模型的评估,普遍性可能有限。
由于它依赖于合成图像数据集,因此可能与真实图像存在差异。
需要进一步审查评估标准以及数据集的客观性和全面性。
👍