Cet article aborde la question de la modification flexible de la cognition et du comportement en fonction d'objectifs. Les humains possèdent la capacité de généraliser leur comportement à de nouvelles situations en exploitant leurs souvenirs épisodiques passés, une capacité qui proviendrait de l'interaction entre le cortex préfrontal (PFC) et l'hippocampe (HPC). Cette étude présente un modèle d'apprentissage par renforcement qui intègre le mécanisme d'interaction PFC-HPC pour une généralisation orientée vers un objectif. Le PFC génère des représentations de clés de requête pour l'encodage et la récupération des souvenirs épisodiques pertinents pour l'objectif et module les souvenirs de l'HPC de manière ascendante en fonction des exigences de la tâche en cours. De plus, il ajuste dynamiquement les stratégies d'encodage et de récupération en fonction de la présentation de plusieurs objectifs. Les résultats expérimentaux démontrent que la combinaison de la mémoire de travail et de souvenirs épisodiques récupérés sélectivement permet le transfert de décisions entre environnements similaires. De plus, le contrôle ascendant du HPC par le PFC améliore l'apprentissage d'associations structurelles arbitraires entre événements pour la généralisation à de nouveaux environnements, par rapport à une approche descendante axée sur les sens. De plus, nous démontrons que le PFC encode des représentations généralisables lors de l'encodage et de la récupération de souvenirs pertinents pour un objectif, tandis que le HPC présente des représentations spécifiques à un événement. En conclusion, nous soulignons l'importance du contrôle préfrontal orienté vers un objectif de la mémoire épisodique hippocampique pour la prise de décision dans des situations nouvelles et suggérons un mécanisme computationnel par lequel les interactions PFC-HPC permettent un comportement flexible.