본 논문은 시각적 패턴으로부터 기호 규칙을 추상화하여 무한을 유한으로부터 추론하는 수학적 추론 능력을 다중 모드 AI 시스템이 갖추고 있는지 연구한다. FractalBench라는 벤치마크를 통해 이미지를 기반으로 프랙탈 프로그램 합성을 평가한다. 프랙탈은 반복 함수 시스템을 통해 복잡한 자기 유사 패턴을 생성하며, 이는 모델이 시각적 인식과 수학적 추상화를 연결해야 함을 의미한다. GPT-4o, Claude 3.7 Sonnet, Gemini 2.5 Flash, Qwen 2.5-VL 등 4개의 선도적인 MLLM을 12개의 대표적인 프랙탈에 대해 평가했다. 모델은 프랙탈을 재현하는 실행 가능한 Python 코드를 생성해야 한다.