본 논문은 자율 주행 자동차의 투명성과 설명 가능성을 향상시키기 위해, 에이전트의 행동에 대한 원인 추론을 가능하게 하는 보상 지표 가중치 학습 방법을 제안합니다. 에이전트가 어떤 보상을 극대화하려는 행위를 한다고 가정하더라도, 에이전트에게 중요한 것을 포착하지 않고서는 정확한 원인 추론을 하기 어렵다는 점에 착안하여, 보상 지표의 가중치를 학습함으로써 에이전트 상호작용에 대한 원인적 설명을 추론하는 것을 목표로 합니다. 세 개의 실제 주행 데이터셋을 사용하여 정량적 및 정성적 검증을 수행하며, 기존 방법보다 기능적으로 향상된 성능과 경쟁력 있는 평가 지표를 달성함을 보여줍니다.