SCMAPR: Self-Correcting Multi-Agent Prompt Refinement for Complex-Scenario Text-to-Video Generation

Created by

Haebom

저자

Chengyi Yang, Pengzhen Li, Jiayin Qi, Aimin Zhou, Ji Wu, Ji Liu

💡 개요

본 논문은 복잡한 시나리오에서 텍스트-영상(T2V) 생성 시 프롬프트의 모호성과 불명확성으로 인한 어려움을 해결하기 위해 SCMAPR이라는 자기 교정 다중 에이전트 프롬프트 정제 프레임워크를 제안합니다. SCMAPR은 각 프롬프트를 시나리오별로 분류하고, 상황 인식 정책을 바탕으로 프롬프트를 수정하며, 오류 발견 시 조건부 수정을 통해 텍스트-영상 정렬과 생성 품질을 향상시킵니다.

🔑 시사점 및 한계

•

복잡한 시나리오 T2V 생성에서 프롬프트 정제의 중요성을 강조하고, 이를 해결하기 위한 효과적인 다중 에이전트 기반 프레임워크를 제시합니다.

•

T2V-Complexity라는 새로운 벤치마크를 통해 복잡한 시나리오에서의 T2V 생성 성능을 체계적으로 평가할 수 있는 기반을 마련했습니다.

•

기존 벤치마크와 제안된 벤치마크 모두에서 SCMAPR이 최신 기술 대비 우수한 성능을 보이며, 텍스트-영상 정렬 및 전반적인 생성 품질을 향상시킴을 입증했습니다.

•

제안된 프레임워크가 더 넓은 범위의 복잡한 시나리오와 다양한 T2V 모델에 어떻게 일반화될 수 있는지에 대한 추가적인 연구가 필요합니다.

PDF 보기

Made with Slashpage