Community Detection on Model Explanation Graphs for Explainable AI
Created by
Haebom
Category
Empty
저자
Ehsan Moradi
개요
MoI(Modules of Influence)는 개별 예측에 대한 설명 외에 더 높은 차원의 구조, 즉 함께 작용하는 특징 집합을 파악하는 프레임워크입니다. MoI는 인스턴스별 속성에서 모델 설명 그래프를 구성하고, 커뮤니티 감지를 적용하여 예측에 공동으로 영향을 미치는 특징 모듈을 찾으며, 이러한 모듈이 편향, 중복성 및 인과 관계 패턴과 어떻게 관련되는지 정량화합니다.
시사점, 한계점
•
시사점:
◦
상관관계가 있는 특징 그룹 발견.
◦
모듈 수준의 제거를 통한 모델 디버깅 개선.
◦
특정 모듈에 대한 편향 노출 위치 파악.
◦
안정성 및 시너지 지표, 참조 구현, XAI의 모듈 발견 벤치마킹을 위한 평가 프로토콜 제공.
•
한계점:
◦
논문에 구체적인 한계점 언급 없음. (다만, 논문의 전체적인 내용을 고려했을 때, 모듈 발견 알고리즘의 정확성, 계산 비용, 실제 적용 시의 복잡성 등이 한계점으로 작용할 수 있음)