Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Aligning Machine and Human Visual Representations across Abstraction Levels

Created by
  • Haebom

作者

Lukas Muttenthaler, Klaus Greff, Frieda Born, Bernhard Spitzer, Simon Kornblith, Michael C. Mozer, Klaus-Robert M uller, Thomas Unterthiner, Andrew K. Lampinen

概要

本論文は,深層ニューラルネットワークが人間の行動と視覚的課題の神経表現モデルとして成功を収めたが,人間学習とは根本的に異なって学習し,人間のように強力な一般化能力を示さないことを指摘している。人間の概念的な知識は微妙な違いから巨視的な違いまで階層的に構成されていますが、モデル表現はこれらの抽象化のすべてのレベルを正確に捉えることができないことを主な不一致として提示します。これを解決するために、人間の判断を模倣するように教師モデルを訓練した後、事前に訓練された最先端の視覚ベースのモデルの表象を微調整して、人間と整列した構造を移行します。その結果、さまざまな類似性の課題で人間の行動と不確実性をより正確に近似し、さまざまな機械学習の課題で一般化と分布外の堅牢性を向上させる人間と整列したモデルが得られます。結論として、ニューラルネットワークに人間の知識を追加することで、人間の認識と実用性の両方を向上させる最適な表象が得られ、より強力で解釈可能であり、人間と整列した人工知能システムに進むことができます。

Takeaways、Limitations

Takeaways:
人間の階層的概念的知識構造をモデルに統合する新しい方法を提示
人間と整列したモデルは、さまざまな課題における人間の行動と不確実性をより正確に反映します。
人間と整列したモデルの一般化と分布外の堅牢性の向上
より強力で解釈可能で人間と整列したAIシステムの開発可能性を提示します。
Limitations:
教師モデルの訓練に使用される人間の判断データの一般化の可能性と代表性のレビューが必要です。
提案された方法の他の視覚的課題および他の種類のデータに対する一般化性能評価が必要である。
人間の知識の階層構造を完全に捉えるための限界と改良のためのさらなる研究の必要性
👍