TMUAD: Enhancing Logical Capabilities in Unified Anomaly Detection Models with a Text Memory Bank
Created by
Haebom
作者
Jiawei Liu, Jiahe Hou, Wei Wang, Jinsong Du, Yang Cong, Huijie Fan
概要
本論文では、従来の統合方式とは異なり、通常のデータの不足により困難に遭遇する異常値検出の問題に対して、テキストメモリバンクを導入して論理的な異常値検出を向上させるThree-Memory framework for Unified structural and logical Anomaly Detection(TMUAD)を提案する. TMUADは、提案された論理認識テキスト抽出器を使用してクラスレベルのテキストメモリバンクを構築し、画像からオブジェクトの豊富な論理説明をキャプチャし、分割されたオブジェクトから特徴を抽出してオブジェクトレベルの画像メモリバンクを構築し、パッチレベルの画像特徴を抽出してパッチレベルのメモリバンクを構築します。これらの3つの相補的なメモリバンクを使用して、クエリ画像に最も近い正常画像を検索し比較し、複数のレベルで異常値スコアを計算し、最終的な異常値スコアに融合する。これにより、構造的および論理的な異常値検出を統合して、産業および医療分野の7つのパブリックデータセットで最先端のパフォーマンスを実現します。モデルとコードはhttps://github.com/SIA-IDE/TMUADで利用可能です。