EasyMath는 소규모 언어 모델의 실용적인 수학 추론을 위한 간결한 벤치마크입니다. 기본적인 산술과 연산 순서부터 수학 문제, 대수식, 예외적인 경우까지 13가지 범주를 다루며 전문적인 주제는 제외합니다. 본 연구는 23개의 모델(14M~4B 파라미터)을 대상으로 자유 형식 답변에 대한 정확한 수치 및 기호 검사를 제로샷 설정에서 수행했습니다. 정확도는 모델의 크기와 학습량에 따라 증가하며, 사고 과정 추가는 약간의 성능 향상을 가져오고, 일관성은 규모가 커짐에 따라 향상됩니다.