Cet article propose une récompense comportementale et contextuelle (BCR) pour relever deux défis majeurs de l'apprentissage par renforcement profond (DRL) dans la collaboration homme-IA (HAIC) : les récompenses éparses et les comportements humains imprévisibles. La BCR repose sur un double système de récompense intrinsèque composé de récompenses intrinsèques auto-motivées par l'IA et de récompenses intrinsèques motivationnelles par l'humain, ainsi que d'un mécanisme de pondération contextuelle qui exploite les informations contextuelles pour améliorer la coopération avec les partenaires humains. Les résultats de simulation dans un environnement surchauffé montrent que la méthode proposée augmente les récompenses éparses cumulatives d'environ 20 % et améliore l'efficacité d'échantillonnage d'environ 38 % par rapport aux références de l'état de l'art.