Sign In

SCMAPR: Self-Correcting Multi-Agent Prompt Refinement for Complex-Scenario Text-to-Video Generation

Created by
  • Haebom
Category
Empty

μ €μž

Chengyi Yang, Pengzhen Li, Jiayin Qi, Aimin Zhou, Ji Wu, Ji Liu

πŸ’‘ κ°œμš”

λ³Έ 논문은 λ³΅μž‘ν•œ μ‹œλ‚˜λ¦¬μ˜€μ—μ„œ ν…μŠ€νŠΈ-μ˜μƒ(T2V) 생성 μ‹œ ν”„λ‘¬ν”„νŠΈμ˜ λͺ¨ν˜Έμ„±κ³Ό 뢈λͺ…ν™•μ„±μœΌλ‘œ μΈν•œ 어렀움을 ν•΄κ²°ν•˜κΈ° μœ„ν•΄ SCMAPRμ΄λΌλŠ” 자기 ꡐ정 닀쀑 μ—μ΄μ „νŠΈ ν”„λ‘¬ν”„νŠΈ μ •μ œ ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. SCMAPR은 각 ν”„λ‘¬ν”„νŠΈλ₯Ό μ‹œλ‚˜λ¦¬μ˜€λ³„λ‘œ λΆ„λ₯˜ν•˜κ³ , 상황 인식 정책을 λ°”νƒ•μœΌλ‘œ ν”„λ‘¬ν”„νŠΈλ₯Ό μˆ˜μ •ν•˜λ©°, 였λ₯˜ 발견 μ‹œ 쑰건뢀 μˆ˜μ •μ„ 톡해 ν…μŠ€νŠΈ-μ˜μƒ μ •λ ¬κ³Ό 생성 ν’ˆμ§ˆμ„ ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
λ³΅μž‘ν•œ μ‹œλ‚˜λ¦¬μ˜€ T2V μƒμ„±μ—μ„œ ν”„λ‘¬ν”„νŠΈ μ •μ œμ˜ μ€‘μš”μ„±μ„ κ°•μ‘°ν•˜κ³ , 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•œ 효과적인 닀쀑 μ—μ΄μ „νŠΈ 기반 ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ‹œν•©λ‹ˆλ‹€.
β€’
T2V-ComplexityλΌλŠ” μƒˆλ‘œμš΄ 벀치마크λ₯Ό 톡해 λ³΅μž‘ν•œ μ‹œλ‚˜λ¦¬μ˜€μ—μ„œμ˜ T2V 생성 μ„±λŠ₯을 μ²΄κ³„μ μœΌλ‘œ 평가할 수 μžˆλŠ” κΈ°λ°˜μ„ λ§ˆλ ¨ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
κΈ°μ‘΄ λ²€μΉ˜λ§ˆν¬μ™€ μ œμ•ˆλœ 벀치마크 λͺ¨λ‘μ—μ„œ SCMAPR이 μ΅œμ‹  기술 λŒ€λΉ„ μš°μˆ˜ν•œ μ„±λŠ₯을 보이며, ν…μŠ€νŠΈ-μ˜μƒ μ •λ ¬ 및 μ „λ°˜μ μΈ 생성 ν’ˆμ§ˆμ„ ν–₯μƒμ‹œν‚΄μ„ μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ ν”„λ ˆμž„μ›Œν¬κ°€ 더 넓은 λ²”μœ„μ˜ λ³΅μž‘ν•œ μ‹œλ‚˜λ¦¬μ˜€μ™€ λ‹€μ–‘ν•œ T2V λͺ¨λΈμ— μ–΄λ–»κ²Œ μΌλ°˜ν™”λ  수 μžˆλŠ”μ§€μ— λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘