본 논문은 목표에 따라 인지와 행동을 유연하게 수정하는 작업에 대해 다룹니다. 인간은 과거의 에피소드 기억을 활용하여 새로운 상황에서도 행동을 일반화하는 능력을 가지고 있으며, 이는 전전두엽 피질(PFC)과 해마(HPC)의 상호작용에 기인한다고 여겨집니다. 본 연구는 목표 지향적 일반화를 위한 PFC-HPC 상호작용 메커니즘을 통합한 강화 학습 모델을 제시합니다. PFC는 목표 관련 에피소드 기억을 인코딩하고 검색하기 위한 쿼리-키 표현을 생성하고, 현재 과제 요구에 따라 HPC 기억을 상향식으로 조절합니다. 또한, 여러 목표가 제시되는 방식에 따라 인코딩 및 검색 전략을 동적으로 조정합니다. 실험 결과, 작업 기억과 선택적으로 검색된 에피소드 기억의 결합이 유사한 환경 간의 의사결정 전이를 가능하게 하고, HPC에 대한 PFC의 상향식 제어가 하향식 감각 주도 방식보다 새로운 환경으로의 일반화를 위한 사건 간의 임의 구조적 연관 학습을 향상시키며, PFC는 목표 관련 기억의 인코딩 및 검색 과정에서 일반화 가능한 표현을 인코딩하는 반면, HPC는 사건 특이적 표현을 보여준다는 것을 확인했습니다. 결론적으로, 새로운 상황에서의 의사결정을 위해 해마 에피소드 기억에 대한 목표 지향적 전전두엽 제어의 중요성을 강조하고, PFC-HPC 상호작용이 유연한 행동을 가능하게 하는 계산 메커니즘을 제시합니다.