Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Foundation versus Domain-specific Models: Performance Comparison, Fusion, and Explainability in Face Recognition

Created by
  • Haebom

作者

Redwan Sony, Parisa Farmanifard, Arun Ross, Anil K. Jain

概要

本稿では、一般的な基礎モデル(CLIP、BLIP、GPT-4o、Grok-4など)と顔認識特化モデル(AdaFace、ArcFace)の顔認識性能を比較分析します。いくつかの基礎モデルとベンチマークデータセットを使用した実験の結果、特化モデルはゼロショット基礎モデルより優れた性能を示し、過度に分割された顔画像でゼロショット基礎モデルのパフォーマンスが向上することを確認しました。さらに、基礎モデルと特化モデルのスコアレベルの融合により、低エラーマッチング率で精度が向上し、GPT-4oやGrok-4などの基礎モデルは顔認識パイプラインの説明可能性を提供し、AdaFaceの低信頼性決定に対処するのに役立ちました。結論として、特化モデルと基礎モデルを適切に組み合わせることが重要であることを強調する。

Takeaways、Limitations

Takeaways:
特化した顔認識モデルがゼロショット基礎モデルより優れた性能を持つことを確認。
過度に分割された画像におけるコンテキスト情報の重要性を提示する。
基礎モデルと特化モデルのスコアレベル融合による性能向上の可能性の提示
基礎モデルを活用した顔認識パイプラインの説明可能性の確保と信頼性向上の可能性の提示
Limitations:
特定の基礎モデルと特化モデル、データセットに限定された実験結果。
スコアレベル融合以外の融合方法のさらなる研究が必要
さまざまな顔の特徴(表情、照明など)のロバースト性評価の欠如。
基礎モデルの記述可能性の定量的評価の欠如
👍