Explainable AI: Context-Aware Layer-Wise Integrated Gradients for Explaining Transformer Models

작성자

Haebom

카테고리

Empty

저자

Melkamu Abay Mersha, Jugal Kalita

💡 개요

본 논문은 트랜스포머 모델의 예측 해석의 어려움을 해결하기 위해 맥락 인지 계층별 통합 그래디언트 (CA-LIG) 프레임워크를 제안한다. CA-LIG는 각 트랜스포머 블록 내에서 계층별 통합 그래디언트를 계산하고 이를 클래스별 어텐션 그래디언트와 통합하여, 계층을 넘나드는 관련성의 흐름을 추적하는 맥락 민감한 속성 맵을 생성한다. 제안된 프레임워크는 다양한 작업, 도메인 및 트랜스포머 모델에서 기존 방법보다 더 충실하고 맥락에 민감한 설명을 제공한다.

🔑 시사점 및 한계

•

트랜스포머 모델의 계층 구조를 고려한 통합적인 설명 방법을 제시하여 해석 가능성을 향상시킨다.

•

맥락적 의존성과 구조적 요소가 의사 결정에 미치는 영향을 포착하여 보다 신뢰할 수 있는 설명을 제공한다.

•

다양한 모델과 작업에 대한 성공적인 평가를 통해 CA-LIG의 일반화 가능성을 입증한다.

•

향후 연구에서는 CA-LIG의 계산 효율성을 개선하고, 설명의 사용자 친화성을 높이는 방향으로 발전이 필요하다.

PDF 보기

Made with Slashpage