본 논문은 기존 신경과학에서의 의사결정 연구가 단순화된 행동 과제에 집중하여 명시적인 보상을 받기 위한 반복적이고 고정적인 행동을 수행하는 동물들을 연구하는 데 그치는 한계를 지적합니다. 이러한 방법은 명시적인 목표에 의해 주도되는 단기간의 행동에 대한 이해만을 제공합니다. 자연 환경에서는 동물들이 종종 관찰 불가능한 내적 동기 부여에 의해 주도되는 더욱 복잡하고 장기적인 행동을 보입니다. 본 연구는 시간에 따라 변하는 역강화학습(IRL)을 이용하여 장기간, 자유롭게 움직이는 행동에서 변화하는 동기를 포착하려는 시도를 확장하여, 과거의 결정을 고려하는 역강화학습 모델인 SWIRL (SWitching IRL)을 제시합니다. SWIRL은 장기적인 행동 서열을 각각 고유한 보상 함수에 의해 지배되는 단기 의사 결정 과정 간의 전환으로 모델링하며, 과거의 결정과 환경적 맥락이 행동을 형성하는 방식을 포착하기 위해 생물학적으로 타당한 과거 의존성을 통합합니다. 시뮬레이션 및 실제 동물 행동 데이터 세트에 SWIRL을 적용하여 과거 의존성이 없는 모델보다 정량적, 정성적으로 우수한 성능을 보임을 입증합니다. 본 연구는 과거 의존적인 정책과 보상을 통합한 최초의 IRL 모델을 제시하여 동물의 복잡하고 자연적인 의사 결정에 대한 이해를 발전시킵니다.