MAViS는 아이디어를 시각적 내러티브로 효율적으로 변환하여 장편 시퀀스 비디오 스토리텔링을 지원하도록 설계된 다중 에이전트 협업 프레임워크입니다. 스크립트 작성, 샷 디자인, 캐릭터 모델링, 키프레임 생성, 비디오 애니메이션 및 오디오 생성을 포함한 여러 단계에 걸쳐 전문화된 에이전트를 조율합니다. 각 단계에서 에이전트는 3E 원칙(탐색, 검토, 향상)에 따라 작동합니다. 현재 생성 모델의 기능적 한계를 고려하여 스크립트와 생성 도구 간의 호환성을 최적화하기 위해 스크립트 작성 지침을 제안합니다. MAViS는 보조 기능, 시각적 품질 및 비디오 표현력에서 최첨단 성능을 달성하며, 모듈식 프레임워크는 다양한 생성 모델 및 도구로 확장 가능합니다.