본 논문은 수학 정리에 대한 장문의 시각적 설명 비디오 생성을 위한 에이전트 기반 접근법인 TheoremExplainAgent를 제시합니다. Manim 애니메이션을 사용하여 5분 이상의 비디오를 생성하며, 다양한 STEM 분야의 240개 정리로 구성된 벤치마크 TheoremExplainBench를 함께 제안합니다. TheoremExplainAgent는 에이전트 계획의 중요성을 보여주며, o3-mini 에이전트는 93.8%의 성공률과 0.77의 종합 점수를 달성했습니다. 하지만 시각적 요소 배치에 대한 사소한 문제점들이 발견되었고, 다중 모드 설명이 텍스트 기반 설명에서는 드러나지 않는 추론상의 결함을 드러내는 것을 확인했습니다.