Este documento demuestra que, si bien los modelos de pronóstico meteorológico basados en IA superan a los sistemas numéricos convencionales de pronóstico meteorológico, aún presentan limitaciones para predecir eventos climáticos extremos sin precedentes. El modelo de pronóstico de alta resolución (HRES) del Centro Europeo de Pronósticos Meteorológicos a Medio Plazo supera sistemáticamente a los modelos de IA de vanguardia, como GraphCast, Pangu-Weather y Fuxi, en la predicción de eventos climáticos extremos sin precedentes. Los modelos de IA exhiben mayores errores de predicción para olas de calor, olas de frío y vientos fuertes sin precedentes que el modelo HRES, y sus errores tienden a aumentar con el número de eventos sin precedentes. En particular, tienden a subestimar las olas de calor sin precedentes y a sobreestimar las olas de frío sin precedentes. Por lo tanto, los modelos meteorológicos de IA tienen limitaciones para extrapolar más allá del dominio de los datos de entrenamiento y para predecir eventos climáticos sin precedentes potencialmente impactantes. Se necesitan una validación y un desarrollo más rigurosos antes de que los modelos de IA se puedan utilizar únicamente para aplicaciones de alto riesgo, como los sistemas de alerta temprana y la gestión de desastres.