본 논문은 추상적인 개념을 전달하는 데 중요한 역할을 하는 교육적 일러스트레이션 생성에 초점을 맞춘 연구입니다. 기존의 멀티모달 대규모 언어 모델(MLLM)의 한계를 극복하기 위해, 텍스트 추론과 도식적 합성을 통합한 자기 반성적 멀티 에이전트 프레임워크인 MAGMA-Edu를 제안합니다. MAGMA-Edu는 두 단계의 공동 진화 파이프라인을 통해 수학적 정확성과 기하학적 충실도, 의미론적 정렬을 보장하며, 내부 자기 반성 모듈을 사용하여 교육적 제약 조건을 충족할 때까지 출력을 평가하고 수정합니다. 다양한 벤치마크에서 GPT-4o를 포함한 기존 MLLM보다 우수한 성능을 보였으며, 교육 콘텐츠 생성 분야의 새로운 기준을 제시했습니다.