本論文は、視覚的知覚を形成する要因が外界の構造なのか脳の内部構造なのかという認知神経科学の根本的な質問について取り上げます。自然な刺激に対する脳反応が個人間で同様の活動パターンを引き起こすことを考慮して、研究者は感覚的表象から高次元の内部表象への変換の過程でこれらの刺激によって誘発される収束が人と深層ニューラルネットワーク(DNN)で共通の経路に従うかどうかを検証しました。個人間の類似性とモデル階層との整列を組み合わせて表象の流れを追跡する統合フレームワークを導入し、3つの独立したfMRIデータセットを分析した結果、個人間に保存される皮質全体のネットワークが2つの経路(シーン構造のための内側腹側経路と社会的および生物学的内容に合わせた側方背側経路)で構成されていることを明らかにしました。これらの機能的組織は、視覚的なDNNの階層によって捕捉されますが、言語モデルでは捕捉されず、視覚的意味変換の特異性を強化します。結論として、人間と人工の両方の視覚的エンコーディングのための収束した計算ソリューションは、外界の構造によって導かれることを示しています。