Sign In

MAVEN A Multi-Agent Framework for Multicultural Text-to-Video Generation

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Shuowei Li, Yuming Zhao, Parth Bhalerao, Oana Ignat

πŸ’‘ κ°œμš”

λ³Έ 논문은 ν…μŠ€νŠΈ-λΉ„λ””μ˜€(T2V) μƒμ„±μ—μ„œ 문화적 닀양성을 μΆ©μ‹€νžˆ ν‘œν˜„ν•˜λŠ” 데 μ΄ˆμ μ„ 맞좰, 닀쀑 μ—μ΄μ „νŠΈ ν”„λ‘¬ν”„νŠΈ μ •μ œ ν”„λ ˆμž„μ›Œν¬μΈ MAVEN을 μ œμ•ˆν•©λ‹ˆλ‹€. MAVEN은 μ‚¬λžŒ, 행동, μœ„μΉ˜ μ°¨μ›μœΌλ‘œ ν”„λ‘¬ν”„νŠΈλ₯Ό λΆ„ν•΄ν•˜μ—¬ 각 μ „λ¬Έ μ—μ΄μ „νŠΈκ°€ 병렬 λ˜λŠ” 순차적으둜 μ²˜λ¦¬ν•˜λ„λ‘ μ„€κ³„λ˜μ—ˆμŠ΅λ‹ˆλ‹€. 이λ₯Ό 톡해 단일 λ¬Έν™” 및 닀쀑 λ¬Έν™” T2V 생성 μ‹œ 문화적 좩싀도λ₯Ό ν–₯μƒμ‹œν‚€λŠ” 것을 λͺ©ν‘œλ‘œ ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
MAVEN ν”„λ ˆμž„μ›Œν¬λŠ” ν…μŠ€νŠΈ-λΉ„λ””μ˜€ μƒμ„±μ—μ„œ 문화적 ν‘œν˜„μ˜ μ •ν™•μ„±κ³Ό 닀양성을 λ†’μ΄λŠ” 데 κΈ°μ—¬ν•©λ‹ˆλ‹€.
β€’
μ „λ¬Έν™”λœ 닀쀑 μ—μ΄μ „νŠΈ 방식을 톡해 문화적 관련성을 μœ μ§€ν•˜λ©΄μ„œλ„ μ‹œκ°μ  ν’ˆμ§ˆκ³Ό μ‹œκ°„μ  일관성을 보쑴할 수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μƒˆλ‘œμš΄ λ¬Έν™”μ μœΌλ‘œ κ·Όκ±°ν•œ ν”„λ‘¬ν”„νŠΈμ™€ λΉ„λ””μ˜€ 벀치마크λ₯Ό κ΅¬μΆ•ν•˜μ—¬ ν–₯ν›„ κ΄€λ ¨ 연ꡬλ₯Ό μœ„ν•œ κΈ°λ°˜μ„ λ§ˆλ ¨ν•©λ‹ˆλ‹€.
β€’
ν–₯ν›„ μ—°κ΅¬μ—μ„œλŠ” 더 λ§Žμ€ λ¬Έν™”κΆŒμ„ ν¬κ΄„ν•˜κ³ , μ—μ΄μ „νŠΈ κ°„μ˜ μƒν˜Έμž‘μš©μ„ λ”μš± μ •κ΅ν•˜κ²Œ μ œμ–΄ν•˜λŠ” λ°©μ•ˆμ΄ 탐색될 수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘