[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Convergent transformations of visual representation in brains and models

Created by
  • Haebom

作者

Pablo Marcos-Manch on, Llu is Fuentemilla

概要

本論文は、視覚的知覚を形成する要因が外界の構造なのか脳の内部構造なのかという認知神経科学の根本的な質問について取り上げます。自然な刺激に対する脳反応が個人間で同様の活動パターンを引き起こすことを考慮して、研究者は感覚的表象から高次元の内部表象への変換の過程でこれらの刺激によって誘発される収束が人と深層ニューラルネットワーク(DNN)で共通の経路に従うかどうかを検証しました。個人間の類似性とモデル階層との整列を組み合わせて表象の流れを追跡する統合フレームワークを導入し、3つの独立したfMRIデータセットを分析した結果、個人間に保存される皮質全体のネットワークが2つの経路(シーン構造のための内側腹側経路と社会的および生物学的内容に合わせた側方背側経路)で構成されていることを明らかにしました。これらの機能的組織は、視覚的なDNNの階層によって捕捉されますが、言語モデルでは捕捉されず、視覚的意味変換の特異性を強化します。結論として、人間と人工の両方の視覚的エンコーディングのための収束した計算ソリューションは、外界の構造によって導かれることを示しています。

Takeaways、Limitations

Takeaways:
人間と深層ニューラルネットワーク(DNN)における視覚情報処理の収束計算ソリューションの存在を明らかにする。
視覚シーン認識における内側 - 腹側経路および側方 - 背側経路の機能的役割を特定する。
視覚情報の意味的変換に対するDNNの有用性を実証
外部世界の構造が視覚知覚形成に重要な役割を果たすことを示唆。
Limitations:
使用されたFMRIデータセットの特定性による一般化の難しさ。
DNNモデルの限界による人間の視覚システムの完全な再現の難しさ
異なる感覚モダリティに対する一般化の可能性の制限
👍