본 논문은 목표에 따라 인지와 행동을 유연하게 수정하는 작업에 대해 다룹니다. 인간은 과거의 에피소드 기억을 활용하여 새로운 유사 상황에서 행동을 일반화하는 능력을 가지고 있으며, 이는 전전두엽 피질(PFC)과 해마(HPC)의 상호작용으로 설명됩니다. 본 연구는 목표 지향적 일반화를 위한 PFC-HPC 상호작용 메커니즘을 통합한 강화 학습 모델을 제시합니다. PFC는 목표 관련 에피소드 기억을 인코딩하고 검색하기 위한 질의-키 표현을 생성하여 현재 과제 요구에 따라 HPC 기억을 상향식으로 조절합니다. 또한, PFC는 블록 방식으로 제시되는 다중 목표에 직면했을 때 인코딩 및 검색 전략을 동적으로 조정합니다. 연구 결과, (1) 작업 기억과 선택적으로 검색된 에피소드 기억을 결합하면 유사한 환경이나 상황 간의 의사결정 전이가 가능하고, (2) HPC에 대한 PFC의 상향식 제어는 하향식 감각 주도 방식에 비해 새로운 환경으로의 일반화를 위한 사건 간의 임의 구조적 연관 학습을 향상시키며, (3) PFC는 목표 관련 기억의 인코딩 및 검색 중에 일반화 가능한 표현을 인코딩하는 반면, HPC는 사건 특정 표현을 보여준다는 것을 밝혔습니다. 이러한 결과는 새로운 상황에서의 의사결정을 위해 해마 에피소드 기억에 대한 목표 지향적 전전두엽 제어의 중요성을 강조하며, PFC-HPC 상호작용이 유연한 행동을 가능하게 하는 계산 메커니즘을 제안합니다.