Este artículo aborda la falta de conjuntos de datos de código abierto a gran escala para el razonamiento científico mediante la presentación del conjunto de datos TextbookReasoning, que contiene 650.000 preguntas de inferencia extraídas de libros de texto de ciencias de nivel universitario, y el conjunto de datos MegaScience, que contiene 1,25 millones de instancias integradas de diversos conjuntos de datos de código abierto. MegaScience se desarrolló mediante la identificación sistemática de subconjuntos óptimos mediante estudios de ablación de diversas metodologías de selección de datos. Además, un sistema de evaluación integral que abarca 15 puntos de referencia garantiza métricas de evaluación precisas. Los resultados experimentales demuestran que el conjunto de datos propuesto supera a los conjuntos de datos científicos de código abierto existentes en términos de rendimiento y eficiencia de entrenamiento. Los modelos de referencia entrenados en MegaScience (Llama3.1, Qwen2.5 y Qwen3) superan significativamente, en promedio, a sus correspondientes modelos de instrucción oficiales. Este artículo contribuye al avance de la investigación en razonamiento científico al divulgar el proceso de limpieza de datos, el sistema de evaluación, el conjunto de datos y los siete modelos entrenados.