Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ScoresActivation: A New Activation Function for Model Agnostic Global Explainability by Design

Created by
  • Haebom
Category
Empty

저자

Emanuel Covaci, Fabian Galis, Radu Balan, Daniela Zaharie, Darian Onchis

개요

본 논문은 투명하고 신뢰할 수 있는 시스템 구축을 위해 대규모 딥러닝 모델의 의사 결정을 이해하는 데 중점을 둡니다. 모델 훈련 과정과 분리된 기존의 사후 설명 방법의 한계를 극복하기 위해, 특징 중요도 추정을 모델 훈련에 직접 통합하는 새로운 차별 가능한 접근 방식을 제시합니다. ScoresActivation 함수를 활용하여 특징 순위를 매기는 메커니즘을 학습 파이프라인에 내장하여, 예측 성능 기여도에 따라 특징의 우선순위를 정하는 방식으로 모델을 훈련합니다. 벤치마크 데이터셋 평가 결과, 제안하는 방법은 SHAP 값 및 실제 특징 중요도와 일치하는 안정적인 특징 순위를 생성하며 높은 예측 성능을 유지합니다. 특징 점수 계산 속도는 SHAP보다 150배 빠르며, 무관한 입력에 대한 견고성 또한 입증되었습니다.

시사점, 한계점

시사점:
모델 훈련 과정에 특징 중요도 추정을 통합하여 설명 가능성을 향상시킴.
SHAP 값 및 실제 특징 중요도와 일치하는 안정적인 특징 순위 제공.
SHAP보다 월등히 빠른 특징 점수 계산 속도.
무관한 입력에 대한 견고성 입증.
모델 정확도와 해석 가능성 간의 간극을 좁히는 확장 가능한 프레임워크 제시.
한계점:
논문에 명시된 한계점은 없음.
👍