본 논문은 기존의 스토리 시각화 연구가 시각적 맥락 일관성에만 집중하여 스토리의 본질적인 의미를 충분히 포착하지 못하는 한계를 지적하며, 이를 해결하기 위한 새로운 프레임워크 VisAgent를 제안합니다. VisAgent는 학습이 필요 없는 다중 에이전트 프레임워크로, 스토리 증류, 의미 일관성, 맥락 일관성을 고려하여 스토리의 핵심 장면을 시각화합니다. 여러 전문화된 에이전트들이 협력하여 서사 구조에 기반한 계층적 프롬프트를 개선하고, 개선된 프롬프트, 장면 요소, 피사체 배치 등 생성된 요소들을 최종 이미지에 매끄럽게 통합하는 에이전트 기반 워크플로우를 사용합니다. 실험적으로 검증된 효과는 VisAgent가 실제 스토리 시각화 응용 프로그램에 적합함을 확인합니다.