Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

TMUAD: Enhancing Logical Capabilities in Unified Anomaly Detection Models with a Text Memory Bank

Created by
  • Haebom

作者

Jiawei Liu, Jiahe Hou, Wei Wang, Jinsong Du, Yang Cong, Huijie Fan

概要

本論文では、従来の統合方式とは異なり、通常のデータの不足により困難に遭遇する異常値検出の問題に対して、テキストメモリバンクを導入して論理的な異常値検出を向上させるThree-Memory framework for Unified structural and logical Anomaly Detection(TMUAD)を提案する. TMUADは、提案された論理認識テキスト抽出器を使用してクラスレベルのテキストメモリバンクを構築し、画像からオブジェクトの豊富な論理説明をキャプチャし、分割されたオブジェクトから特徴を抽出してオブジェクトレベルの画像メモリバンクを構築し、パッチレベルの画像特徴を抽出してパッチレベルのメモリバンクを構築します。これらの3つの相補的なメモリバンクを使用して、クエリ画像に最も近い正常画像を検索し比較し、複数のレベルで異常値スコアを計算し、最終的な異常値スコアに融合する。これにより、構造的および論理的な異常値検出を統合して、産業および医療分野の7つのパブリックデータセットで最先端のパフォーマンスを実現します。モデルとコードはhttps://github.com/SIA-IDE/TMUADで利用可能です。

Takeaways、Limitations

Takeaways:
テキストメモリバンクを活用して論理的な異常値検出性能を向上
構造的および論理的異常値検出を統合することで総合的な異常値検出性能を向上
さまざまな産業および医療分野のデータセットで最先端のパフォーマンスを達成。
オープンソースで公開され、アクセシビリティと活用も向上。
Limitations:
提案された論理認識テキスト抽出器の性能の詳細な分析の欠如
様々な種類の異常値の一般化性能評価が必要
メモリバンクのサイズと管理の効率分析の欠如
特定のデータセットに対する過適合性。
👍