Cet article démontre que, si les modèles de prévision météorologique basés sur l'IA surpassent les systèmes de prévision numérique conventionnels, ils présentent néanmoins des limites pour prédire des événements météorologiques extrêmes sans précédent. Le modèle de prévision haute résolution (HRES) du Centre européen pour les prévisions météorologiques à moyen terme surpasse systématiquement les modèles d'IA de pointe, notamment GraphCast, Pangu-Weather et Fuxi, pour prédire des événements météorologiques extrêmes records. Les modèles d'IA présentent des erreurs de prévision plus importantes pour les vagues de chaleur, les vagues de froid et les vents violents records que le modèle HRES, et leurs erreurs tendent à augmenter avec le nombre d'événements records. En particulier, ils ont tendance à sous-estimer les vagues de chaleur et à surestimer les vagues de froid records. Par conséquent, les modèles météorologiques basés sur l'IA présentent des limites pour extrapoler au-delà du domaine des données d'entraînement et pour prédire des événements météorologiques records potentiellement impactants. Une validation et un développement plus rigoureux sont nécessaires avant que les modèles d'IA puissent être utilisés uniquement pour des applications à haut risque telles que les systèmes d'alerte précoce et la gestion des catastrophes.