본 논문은 수기 수학 식 인식(HMER) 분야의 데이터 부족 문제를 해결하기 위해, 대규모 LaTeX 렌더링 수식과 제한된 수기 수식을 통합하는 새로운 방법을 제안합니다. 대규모 LaTeX 수식 생성을 위한 확장 가능한 데이터 엔진을 개발하여 8천만 개 이상의 고품질 학습 인스턴스로 구성된, 현재까지 가장 큰 수식 데이터셋인 Tex80M을 구축했습니다. 이를 기반으로, Tex80M과 상대적으로 작은 HME 데이터셋을 혼합 학습하여 최초의 대규모 HMER 모델인 TexTeller를 제안합니다. TexTeller는 거의 모든 벤치마크에서 최첨단(SOTA) 성능을 달성했습니다. 모델, 데이터셋, 코드베이스를 공개하여 후속 연구를 지원합니다.