每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

ACD-CLIP:零样本异常检测的解耦表示和动态融合

Created by
  • Haebom

作者

马柯、龙俊、费红晓、刘杰华、戴震、罗月怡

大纲

由于缺乏密度估计所需的局部归纳偏差以及特征融合范式不够灵活,预训练的视觉语言模型 (VLM) 在零样本异常检测 (ZSAD) 方面表现不佳。本文提出了一个架构协同设计框架,旨在共同提升特征表示和跨模态融合的性能。我们提出了一个参数高效的卷积低秩自适应 (Conv-LoRA) 适配器来注入局部归纳偏差,并提出了一个动态融合网关 (DFG) 来自适应地调整文本提示,从而实现稳健的双向融合。在各种工业和医疗基准上进行的大量实验证明了其卓越的准确性和稳健性,证实了这种协同协同设计对于将基础模型稳健地应用于密度感知任务至关重要。

Takeaways, Limitations

Takeaways:
通过利用 Conv-LoRA 适配器和注入局部归纳偏差的 DFG 的架构协同设计框架来提高 VLM 的 ZSAD 性能。
与各种工业和医疗基准中的现有方法相比,实现了更高的准确性和稳健性。
展示协同效应,以有效地将基础模型适应密度感知任务。
Limitations:
摘要中没有说明具体的 Limitations(根据提供的信息未知)。
👍