# Manifold-Aligned Guided Integrated Gradients for Reliable Feature Attribution

### 저자

Soyeon Kim, Seongwoo Lim, Kyowoon Lee, Jaesik Choi

### 💡 개요

본 논문은 딥러닝 모델의 신뢰성 확보를 위해 널리 사용되는 Integrated Gradients(IG) 방법론이 불안정한 기울기 영역을 지날 때 설명이 신뢰할 수 없다는 문제를 제기합니다. 이를 해결하기 위해 제안된 Manifold-Aligned Guided Integrated Gradients(MA-GIG)는 사전 학습된 VAE의 잠재 공간에서 기울기 계산 경로를 구성하여 데이터 매니폴드에서 벗어나는 것을 방지합니다. MA-GIG는 이러한 접근 방식을 통해 더욱 충실하고 신뢰할 수 있는 특징 중요도 설명을 제공하며, 기존 방법론보다 우수한 성능을 보입니다.

### 🔑 시사점 및 한계

- MA-GIG는 데이터 매니폴드 상에서 특징 중요도를 계산함으로써 불안정한 기울기 영역에 대한 민감도를 효과적으로 줄여, 더욱 신뢰할 수 있는 설명을 제공합니다.

- 잠재 공간에서의 경로 구성은 모델의 내부 표현을 활용하여 입력 공간에서의 비현실적인 중간 상태를 피하고, 설명의 충실도를 높입니다.

- 제안된 방법은 VAE와 같은 생성 모델의 사전 학습 및 잠재 공간에서의 연산에 의존하므로, 해당 생성 모델의 품질이 MA-GIG의 성능에 영향을 미칠 수 있으며, 계산 복잡성이 증가할 수 있습니다.

[PDF 보기](https://arxiv.org/pdf/2605.02167)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).