Para abordar la escasez de datos en el campo del reconocimiento de expresiones matemáticas manuscritas (HMER), este artículo propone un método novedoso para integrar ecuaciones generadas en LaTeX a gran escala con un número limitado de ecuaciones manuscritas. Desarrollamos un motor de datos escalable para la generación de ecuaciones LaTeX a gran escala y construimos Tex80M, el mayor conjunto de datos de ecuaciones hasta la fecha, con más de 80 millones de instancias de entrenamiento de alta calidad. Basándonos en esto, proponemos TexTeller, el primer modelo HMER a gran escala, mediante entrenamiento híbrido con Tex80M y el relativamente pequeño conjunto de datos HME. TexTeller alcanza un rendimiento de vanguardia (SOTA) en prácticamente todos los benchmarks. Publicamos el modelo, el conjunto de datos y el código fuente para impulsar futuras investigaciones.