Este artículo evalúa el poder predictivo de los modelos lingüísticos a gran escala (LLM) de vanguardia. Utilizando 464 preguntas de predicción de Metaculus, comparamos el rendimiento de los LLM con el de superpredictores humanos. Los resultados muestran que, si bien los modelos de vanguardia obtienen mejores puntuaciones en la escala Brier que la población humana, aún se encuentran significativamente por debajo de los superpredictores. Esto sugiere que, si bien los LLM demuestran un rendimiento notable en diversas tareas, su poder predictivo aún está poco explorado.