Cet article examine les lacunes en matière de sensibilisation culturelle des modèles linguistiques génératifs à grande échelle (MLG). Nous étudions plus particulièrement les effets des techniques de génération augmentée utilisant la recherche dans une base de connaissances personnalisée (base de connaissances) et la recherche sur le Web (base de recherche) sur la familiarité culturelle des LLM dans différentes cultures nationales. Nous comparons les LLM standard, les LLM basés sur la base de connaissances et les LLM basés sur la recherche à l'aide de plusieurs critères de sensibilisation culturelle, et constatons que la base de recherche améliore significativement les performances des LLM aux tests à choix multiples évaluant les connaissances propositionnelles (par exemple, les normes culturelles, les artefacts et les institutions). En revanche, la base de connaissances basée sur la base de connaissances a une efficacité limitée en raison d'une couverture inadéquate de la base de connaissances et d'un moteur de recherche sous-optimal. Cependant, la base de recherche augmente le risque de jugements stéréotypés dans les modèles linguistiques et ne parvient pas à améliorer les jugements des évaluateurs sur la familiarité culturelle lors d'évaluations humaines avec une puissance statistique suffisante. Par conséquent, nous mettons en évidence l'écart entre les connaissances culturelles propositionnelles et la maîtrise culturelle ouverte lors de l'évaluation de la sensibilisation culturelle des LLM.