每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

利用几何视觉错觉作为视觉模型的感知归纳偏差

Created by
  • Haebom

作者

杨浩波、郭明浩、杨德全、王文宇

大纲

本文提出了一种新方法,利用认知心理学中研究的几何错觉来提升深度学习模型的图像分类性能。我们生成了一个包含几何错觉的合成数据集,并评估了三种将其与 ImageNet 分类任务相结合的多源学习策略。实验结果表明,将错觉识别任务作为一项额外的监督学习任务可以提升泛化性能,尤其对于涉及复杂轮廓和精细纹理的复杂视觉样本而言。此外,我们还证明了由合成刺激产生的认知诱导归纳偏差可以增强 CNN 和基于 Transformer 的架构的结构敏感性。这些结果展现了认知科学与机器学习的全新融合,并为将认知先验知识融入视觉模型设计指明了新的方向。

Takeaways, Limitations

Takeaways:
我们证明使用几何错觉的多源学习可以提高图像分类模型的泛化性能。
我们认为认知诱导的归纳偏差可以增强 CNN 和 Transformer 架构的结构敏感性。
我们通过认知科学和机器学习的融合提出了视觉模型设计的新方向。
Limitations:
需要进一步研究来探索所提出的合成数据集的普遍性。
需要对不同类型的错觉和更复杂的视觉刺激进行进一步的实验。
我们需要评估真实世界图像的泛化性能。
👍