본 논문은 다중 모달 소형 언어 모델(MSLM)의 추론 능력 향상을 위한 새로운 프레임워크인 Infi-MMR을 제안합니다. Infi-MMR은 고품질 텍스트 기반 추론 데이터셋을 활용한 기초 추론 활성화 단계, 캡션이 추가된 다중 모달 데이터를 이용한 교차 모달 추론 적응 단계, 그리고 캡션 없는 다중 모달 데이터를 활용한 다중 모달 추론 향상 단계의 세 단계로 구성된 커리큘럼을 통해 MSLM의 추론 잠재력을 체계적으로 향상시킵니다. 제안된 모델 Infi-MMR-3B는 MathVerse testmini, MathVision test, OlympiadBench 등 다양한 수학 추론 및 일반 추론 벤치마크에서 최첨단 성능을 달성했습니다.