Cet article présente un nouveau cadre permettant d'estimer plus précisément la confiance humaine dans la collaboration homme-robot. Les systèmes de réputation bêta existants actualisant la confiance en fonction de performances binaires (succès/échec), ils présentent des limites pour capturer efficacement les variations continues de confiance tout au long du processus de collaboration. De plus, la conception manuelle des fonctions de récompense est complexe. Pour résoudre ce problème, nous proposons un nouveau cadre d'estimation de la confiance basé sur la réputation bêta. Ce cadre actualise la confiance à chaque pas de temps en utilisant des valeurs de récompense continues et génère automatiquement des fonctions de récompense grâce à l'optimisation par entropie maximale. Cela peut améliorer la précision de l'estimation de la confiance et résoudre la difficulté de la conception manuelle des fonctions de récompense, contribuant ainsi au développement de robots plus intelligents.