# A Survey on Mechanistic Interpretability for Multi-Modal Foundation Models

### 저자

Zihao Lin, Samyadeep Basu, Mohammad Beigi, Varun Manjunatha, Ryan A. Rossi, Zichao Wang, Yufan Zhou, Sriram Balasubramanian, Arman Zarei, Keivan Rezaei, Ying Shen, Barry Menglong Yao, Zhiyang Xu, Qin Liu, Yuxiang Zhang, Yan Sun, Shilong Liu, Li Shen, Hongxuan Li, Soheil Feizi, Lifu Huang

### 개요

본 논문은 기초 모델의 발전으로 인해 발생한 해석 가능성 문제, 특히 다중 모드 기초 모델(MMFM)의 해석 가능성 문제에 초점을 맞추고 있습니다.  LLM 해석 방법을 MMFM에 적용하는 방법과 단일 모드 언어 모델과 다중 모드 시스템 간의 기계적 차이를 이해하는 두 가지 핵심 측면을 탐구합니다.  현재의 MMFM 분석 기술을 체계적으로 검토하여 해석 가능성 방법의 구조화된 분류 체계를 제안하고, 단일 모드 및 다중 모드 아키텍처 간의 통찰력을 비교하며, 중요한 연구 격차를 강조합니다.

### 시사점, 한계점

- **시사점:** MMFM 해석 가능성 방법에 대한 구조화된 분류 체계를 제공하여 연구자들이 관련 연구를 더 효율적으로 수행할 수 있도록 돕습니다.  LLM 해석 방법을 MMFM에 적용하는 방법과 단일 모드와 다중 모드 시스템 간의 차이점에 대한 이해를 증진시킵니다.  향후 연구 방향을 제시하여 MMFM 해석 가능성 분야의 발전에 기여합니다.

- **한계점:**  본 논문은 기존 연구들을 종합적으로 검토하는 서베이 논문이므로, 새로운 방법론을 제시하지는 않습니다.  MMFM의 해석 가능성에 대한 연구가 아직 초기 단계이므로, 논문에서 다루는 내용이 미래 연구의 발전에 따라 수정될 가능성이 있습니다.  특정 MMFM 아키텍처에 편향된 분석이 있을 수 있습니다.

[PDF 보기](https://arxiv.org/pdf/2502.17516)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).