본 논문은 저자원 언어인 투르크어족에 대한 대규모 다중 작업 언어 이해(MMLU) 벤치마크의 부족을 해결하기 위해, 8개 투르크어(아제르바이잔어, 크림 타타르어, 카라칼팍어, 카자흐어, 타타르어, 터키어, 위구르어, 우즈베크어)를 포함하는 새로운 벤치마크 TUMLU를 제안합니다. TUMLU는 중고등학교 수준의 11개 학문 분야 질문으로 구성되며, 더 간결하고 검증된 하위 집합인 TUMLU-mini도 함께 제공합니다. 본 논문에서는 Claude, Gemini, GPT, LLaMA 등 다양한 다국어 LLM들을 TUMLU를 이용하여 평가하고, 언어, 과목, 알파벳별 성능 분석을 제공합니다. TUMLU-mini와 평가 스크립트는 공개되어 추가 연구를 지원합니다.