Cet article présente une étude sur le développement d'un modèle de réseau booléen probabiliste dynamique afin de comprendre le réseau moléculaire sous-jacent à la résistance innée à l'immunothérapie anti-PD-1 dans le mélanome métastatique. À l'aide de données transcriptomiques issues de biopsies tumorales de patients, nous découvrons la logique régulatrice qui contrôle la réponse au traitement, identifions systématiquement les interventions thérapeutiques optimales en plusieurs étapes grâce à des agents d'apprentissage par renforcement, et interprétons mécaniquement la politique de contrôle de l'agent grâce à une intelligence artificielle explicative. Notre analyse révèle qu'une inhibition transitoire précise et contrôlée dans le temps en quatre étapes de la protéine lysyl oxydase-like 2 (LOXL2) est la stratégie la plus efficace. Une analyse explicative montre que de telles interventions « éclair » suffisent à effacer les caractéristiques moléculaires à l'origine de la résistance, et que le réseau peut s'autocorriger sans intervention continue. Cette étude propose une nouvelle hypothèse de traitement dépendant du temps pour surmonter la résistance à l'immunothérapie et fournit un cadre informatique puissant pour identifier les protocoles d'intervention flous dans les systèmes biologiques complexes.