본 논문은 금융 분석, 연구 발표, 교육 및 의료 분야에서 자동 보고서 생성을 강화할 수 있는 차트 생성을 위한 비전-언어 모델(VLM) 기반 다중 에이전트 프레임워크인 METAL을 제안합니다. METAL은 차트 생성 작업을 전문화된 에이전트 간의 반복적인 협업으로 분해하여 시각적 디자인 기술과 코드 작성 능력을 모두 필요로 하는 고품질 차트 생성 문제를 해결합니다. 기존 최고 성능 대비 5.2% 향상된 정확도를 달성했으며, 계산 비용이 증가함에 따라 성능이 향상되는 테스트 시간 확장 현상을 보였습니다. 또한, METAL의 비평 과정에서 모달리티를 분리하는 것이 다중 모드 맥락에서 VLM의 자기 수정 능력을 향상시킨다는 것을 발견했습니다.