Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Towards Efficient Pixel Labeling for Industrial Anomaly Detection and Localization

Created by
  • Haebom

作者

Jingqi Wu, Hanxi Li, Lin Yuanbo Wu, Hao Chen, Deyin Liu, Peng Wang

概要

この論文は、産業用製品検査のための相互作用画像分割(IIS)アルゴリズムであるADClickを提案します。 ADClickは、不良サンプルのピクセル単位の注釈なしで、ユーザーの数回のクリックと簡単なテキストの説明だけでピクセル単位の異常検出注釈を生成し、異常検出モデルのパフォーマンスを大幅に向上させます(例:MVTec ADのAP = 96.1%)。また、視覚的特徴とテキストプロンプトを円形ベースのアプローチでソートするマルチモードフレームワークであるADClick-Segも紹介します。ピクセルレベルの辞書情報と言語指令信号を組み合わせて、ADClick-Segは困難な「マルチクラス」異常検出操作で最先端の結果を達成します(MVTec ADではAP = 80.0%、PRO = 97.5%、Pixel-AUROC = 99.1%)。

Takeaways、Limitations

Takeaways:
ピクセル単位の注釈なしで効率的で正確な異常検出注釈を生成可能
ユーザーのクリックとテキストの説明だけで正確な異常検出が可能
マルチモードフレームワークによる視覚的特徴とテキストプロンプトの有効活用
MVTec ADデータセットで最先端のパフォーマンスを実現
Limitations:
提案した方法の一般化性能に対する追加実験の必要性
さまざまな産業環境および製品タイプの適用性評価が必要
ユーザークリック数やテキスト説明の質に応じたパフォーマンスの変化に関する分析が必要
👍