Cet article évalue le pouvoir prédictif des modèles linguistiques à grande échelle (MLH) de pointe. À l'aide de 464 questions de prédiction de Metaculus, nous avons comparé les performances des LHH à celles de super-prédicteurs humains. Les résultats montrent que, si les modèles de pointe obtiennent de meilleurs scores Brier que la population humaine, ils restent significativement en retrait par rapport aux super-prédicteurs. Cela suggère que, si les LHH affichent des performances remarquables dans diverses tâches, leur pouvoir prédictif reste sous-exploré.