Cet article aborde le phénomène des modèles d'IA à grande échelle qui harmonisent la diversité linguistique et culturelle en une représentation générale homogène, ou « softmaxing culturel ». Il s'agit d'un défi fondamental pour l'évaluation de l'IA et d'un élément clé des efforts d'harmonisation culturelle. Il souligne les limites des approches actuelles d'apprentissage automatique (AA) et d'interaction homme-machine (IHM) et propose deux changements conceptuels : au lieu de se demander « qu'est-ce que la culture ? » lors de l'évaluation d'un système, il faudrait se demander « quand est-ce que la culture ? » et positionner les éléments culturels universels par rapport à des éléments spécifiques. Ainsi, nous soutenons qu'il est nécessaire de dépasser les exigences techniques pour adopter une méthode d'évaluation plus sensible à la complexité culturelle.