본 논문은 문서 지능 분야에서 중요한 과제인 수식 인식을 위한 최첨단 모델인 PP-FormulaNet을 제시합니다. PP-FormulaNet은 정확성과 효율성 모두에서 뛰어난 성능을 보이며, 정확도를 중시하는 PP-FormulaNet-L과 효율성을 중시하는 PP-FormulaNet-S 두 가지 모델로 구성됩니다. 실험 결과, PP-FormulaNet-L은 UniMERNet과 같은 기존 최고 성능 모델보다 6% 높은 정확도를 달성했고, PP-FormulaNet-S는 16배 이상 빠른 속도를 보였습니다. 또한, 고품질 수식 데이터를 대량으로 추출할 수 있는 Formula Mining System도 함께 소개하여 모델의 강건성과 적용성을 높였습니다. 모델과 코드는 PaddleOCR과 PaddleX에서 공개됩니다.