본 논문은 강화학습 에이전트의 행동을 설명하는 상호작용적 설명 시스템 ASQ-IT를 제안한다. 기존의 설명 가능한 강화학습(XRL) 방법들이 개발자의 직관에 기반한 정적인 설명을 제공하는 것과 달리, ASQ-IT는 사용자의 질의에 기반하여 에이전트의 행동을 보여주는 비디오 클립을 제공한다. 사용자 질의는 선형 시간 논리(LTLf)의 일부로 표현되며, 자동이론에 기반한 알고리즘을 통해 처리된다. 사용자 연구 결과, ASQ-IT를 통해 사용자는 에이전트의 잘못된 행동을 식별하는 데 도움을 받을 수 있음을 보여준다.