InkFM이라는 전 페이지 필기 내용 분석을 위한 기초 모델을 소개합니다. 28개의 서로 다른 스크립트의 텍스트 인식, 수학식 인식, 페이지를 텍스트와 그림과 같은 개별 요소로 분할하는 기능을 결합하여 다양한 작업에 대해 훈련되었습니다. docTR과 같은 공개 기준보다 우수한 최첨단 텍스트 라인 분할 품질을 달성하며, 공개 데이터셋으로 미세 조정 또는 LoRA 조정을 통해 페이지 분할 품질 향상, 최첨단 텍스트 인식(DeepWriting, CASIA, SCUT, Mathwriting 데이터셋) 및 스케치 분류(QuickDraw)를 달성합니다. 필기 입력을 사용하는 응용 프로그램 개발을 위한 강력한 기반을 제공합니다.