Bài báo này đề cập đến nhiệm vụ điều chỉnh nhận thức và hành vi một cách linh hoạt dựa trên các mục tiêu. Con người có khả năng khái quát hóa hành vi cho các tình huống mới bằng cách tận dụng ký ức tình tiết trong quá khứ, một khả năng được cho là bắt nguồn từ sự tương tác giữa vỏ não trước trán (PFC) và hồi hải mã (HPC). Nghiên cứu này trình bày một mô hình học tăng cường tích hợp cơ chế tương tác PFC-HPC để khái quát hóa theo mục tiêu. PFC tạo ra các biểu diễn khóa truy vấn để mã hóa và truy xuất ký ức tình tiết liên quan đến mục tiêu và điều chỉnh ký ức HPC theo cách từ dưới lên dựa trên các yêu cầu của nhiệm vụ hiện tại. Hơn nữa, nó điều chỉnh động các chiến lược mã hóa và truy xuất dựa trên việc trình bày nhiều mục tiêu. Kết quả thực nghiệm chứng minh rằng sự kết hợp giữa bộ nhớ làm việc và ký ức tình tiết được truy xuất có chọn lọc cho phép chuyển giao quyết định trong các môi trường tương tự. Hơn nữa, việc PFC kiểm soát HPC từ dưới lên giúp tăng cường khả năng học các mối liên hệ cấu trúc tùy ý giữa các sự kiện để khái quát hóa sang các môi trường mới so với cách tiếp cận từ trên xuống, dựa trên cảm giác. Hơn nữa, chúng tôi chứng minh rằng PFC mã hóa các biểu diễn tổng quát trong quá trình mã hóa và truy xuất ký ức liên quan đến mục tiêu, trong khi HPC thể hiện các biểu diễn cụ thể theo sự kiện. Tóm lại, chúng tôi nhấn mạnh tầm quan trọng của việc kiểm soát vùng tiền trán hướng đến mục tiêu đối với trí nhớ tình tiết hồi hải mã trong việc ra quyết định trong các tình huống mới và đề xuất một cơ chế tính toán mà qua đó tương tác PFC-HPC cho phép hành vi linh hoạt.