본 논문은 루마니아어 수학 추론 벤치마크 모음인 RoMath를 소개합니다. RoMath는 고등학교 시험, 수학 경시대회, 그리고 합성 데이터셋의 세 가지 하위 데이터셋으로 구성되어 다양한 수학 영역과 난이도를 다룹니다. 기존의 수학 언어 모델 벤치마크들이 영어에 치중되어 있는 점을 고려하여, 자원이 부족한 루마니아어를 중심으로 비영어권 언어 모델의 성능 향상과 다국어 AI 개발을 촉진하고자 합니다. 루마니아어의 독특한 언어적 특징을 고려하여 영어 중심 모델의 한계를 극복하고, 단순한 자동 번역을 넘어선 전문적인 자원의 필요성을 강조합니다. 여러 개방형 언어 모델들의 성능을 벤치마킹하여 저자원 언어를 위한 자원 개발의 중요성을 보여줍니다. 코드와 데이터셋은 공개될 예정입니다.