본 논문은 최적의 시스템 반응이 인과 및 반실제적 지식에 기반한 적응적 전략에서 나온다는 가설을 제시합니다. 반실제 추론을 통해 가상 시나리오를 생성하여 대안적인 시스템 반응의 효과를 검토하고, 인과적 발견을 통해 시스템 동작을 지배하는 기저 인과 구조에 의해 알려진 전략을 식별하여 이 과정을 향상시킵니다. 또한 사용자-시스템 상호 작용에 영향을 미칠 수 있는 심리적 구성 요소와 관찰 불가능한 노이즈를 잠재 요인으로 고려하여 효과적으로 추정하는 방법을 제시합니다. 인과적 발견을 사용하여 사용자 및 시스템 발화 간의 전략 수준 인과 관계를 식별하고, 개인화된 반실제 대화 생성을 안내합니다. 사용자 발화 전략을 인과적 요인으로 모델링하여 시스템 전략을 반실제적 행동으로 취급할 수 있도록 합니다. 또한 반실제 데이터를 기반으로 시스템 반응 선택 정책을 최적화합니다. 사회적 선(social good)에 대한 실제 데이터 세트를 사용한 결과, 설득력 있는 시스템 결과가 크게 향상되었으며, 누적 보상이 증가하여 인과적 발견이 개인화된 반실제 추론을 안내하고 설득력 있는 대화 시스템의 대화 정책을 최적화하는 데 효과적임을 확인했습니다.