SCMAPR: Self-Correcting Multi-Agent Prompt Refinement for Complex-Scenario Text-to-Video Generation

Created by

Haebom

저자

Chengyi Yang, Pengzhen Li, Jiayin Qi, Aimin Zhou, Ji Wu, Ji Liu

💡 개요

본 논문은 복잡한 시나리오에서의 텍스트-비디오(T2V) 생성 시 발생하는 프롬프트의 모호성과 불완전성을 해결하기 위해 SCMAPR이라는 자기 교정 다중 에이전트 프롬프트 정제 프레임워크를 제안합니다. SCMAPR은 시나리오 분류, 정책 기반 수정, 구조화된 의미 검증을 통해 프롬프트를 단계적으로 개선하며, 복잡한 시나리오 T2V 생성을 위한 새로운 벤치마크인 T2V-Complexity도 함께 소개합니다. 실험 결과, SCMAPR은 기존 방법론 대비 T2V 생성 품질과 텍스트-비디오 정렬을 유의미하게 향상시켰습니다.

🔑 시사점 및 한계

•

복잡한 시나리오 T2V 생성에서 프롬프트 정제의 중요성을 부각하고, 이를 위한 체계적인 다중 에이전트 접근 방식을 제시합니다.

•

T2V-Complexity 벤치마크는 복잡한 시나리오 T2V 생성 연구 및 평가의 필요성을 강조하며, 향후 관련 연구 발전에 기여할 것입니다.

•

제안된 프레임워크는 여전히 복잡한 시나리오의 모든 측면을 완전히 포괄하지 못할 수 있으며, 에이전트 간의 효율적인 협업 및 의사결정 메커니즘 개선은 향후 과제로 남습니다.

PDF 보기

Made with Slashpage