Este artículo plantea la cuestión de que los modelos lingüísticos a gran escala (LLM) aceleran la generación de ideas científicas, pero la evaluación rigurosa de la novedad y la precisión fáctica de las propuestas generadas constituye un obstáculo. Los métodos de verificación existentes son inadecuados: los propios LLM son alucinógenos o carecen de experiencia, las redes de citas existentes carecen de causalidad explícita y las investigaciones narrativas son asistemáticas. Para abordar estas cuestiones, en este artículo proponemos THE-Tree (Árbol de Evolución de la Historia de la Tecnología), un marco computacional que construye árboles evolutivos a partir de la literatura científica en un campo específico. THE-Tree utiliza un algoritmo de búsqueda para explorar las trayectorias evolutivas y, mediante un proceso denominado "Pensar-Verbalizar-Citar-Verificar", los LLM proponen desarrollos potenciales, citan la literatura de apoyo y examinan la literatura citada para verificar la coherencia lógica y la evidencia en cada paso. Construimos y verificamos 88 THE-Tree en diversos campos y publicamos un conjunto de datos de referencia que contiene más de 71 000 verificaciones de hechos. Los resultados experimentales muestran que THE-Tree supera a los métodos existentes en la finalización de gráficos, la predicción de desarrollos científicos futuros y la evaluación de artículos científicos importantes.