Sign In

OmniCustom: Sync Audio-Video Customization Via Joint Audio-Video Generation Model

Created by
  • Haebom
Category
Empty

μ €μž

Maomao Li, Zhen Li, Kaipeng Zhang, Guosheng Yin, Zhifeng Li, Dong Xu

πŸ’‘ κ°œμš”

λ³Έ 논문은 기쑴의 μ˜μƒ μ‚¬μš©μž μ •μ˜ 방식이 μ°Έμ‘° 이미지와 ν…μŠ€νŠΈ ν”„λ‘¬ν”„νŠΈλ₯Ό 기반으둜 동일 인물의 μ˜μƒμ„ μƒμ„±ν•˜λŠ” 데 μ§‘μ€‘ν–ˆλ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κ³ μž ν•©λ‹ˆλ‹€. μƒˆλ‘­κ²Œ μ œμ•ˆν•˜λŠ” 동기화 μ˜€λ””μ˜€-λΉ„λ””μ˜€ μ‚¬μš©μž μ •μ˜λŠ” μ°Έμ‘° μ΄λ―Έμ§€μ˜ 인물 정보와 μ°Έμ‘° μ˜€λ””μ˜€μ˜ μŒμƒ‰ 정보λ₯Ό λ™μ‹œμ— μ‚¬μš©μž μ •μ˜ν•˜μ—¬, μ‚¬μš©μžκ°€ μ œκ³΅ν•œ ν…μŠ€νŠΈ ν”„λ‘¬ν”„νŠΈμ— 따라 λ§ν•˜λŠ” λ‚΄μš©κΉŒμ§€ 자유둭게 생성할 수 μžˆλŠ” ν˜μ‹ μ μΈ μ—°κ΅¬μž…λ‹ˆλ‹€. 이λ₯Ό μœ„ν•΄ OmniCustomμ΄λΌλŠ” κ°•λ ₯ν•œ DiT 기반 μ˜€λ””μ˜€-λΉ„λ””μ˜€ μ‚¬μš©μž μ •μ˜ ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•˜λ©°, μ°Έμ‘° μ΄λ―Έμ§€μ˜ 인물, μ°Έμ‘° μ˜€λ””μ˜€μ˜ μŒμƒ‰, 그리고 ν…μŠ€νŠΈ ν”„λ‘¬ν”„νŠΈλ₯Ό λ™μ‹œμ— κ³ λ €ν•˜μ—¬ μ œλ‘œμƒ· λ°©μ‹μœΌλ‘œ μ˜μƒμ„ ν•©μ„±ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
AI 기반 μ˜μƒ 및 μŒμ„± μ½˜ν…μΈ  μ œμž‘μ˜ μƒˆλ‘œμš΄ 지평: μ°Έμ‘° 이미지와 μ˜€λ””μ˜€λ₯Ό κ²°ν•©ν•˜μ—¬ μ›ν•˜λŠ” 인물의 μ›ν•˜λŠ” λͺ©μ†Œλ¦¬λ‘œ, μ›ν•˜λŠ” λ‚΄μš©μ˜ μ˜μƒμ„ μ‹€μ‹œκ°„μœΌλ‘œ 생성할 수 μžˆλŠ” κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€. μ΄λŠ” κ°œμΈν™”λœ μ½˜ν…μΈ  μ œμž‘, ꡐ윑, μ—”ν„°ν…ŒμΈλ¨ΌνŠΈ λ“± λ‹€μ–‘ν•œ 뢄야에 ν˜μ‹ μ μΈ λ³€ν™”λ₯Ό κ°€μ Έμ˜¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
λ™κΈ°ν™”λœ μ˜€λ””μ˜€-λΉ„λ””μ˜€ μƒμ„±μ˜ 정ꡐ함 ν–₯상: λ³„λ„μ˜ LoRA λͺ¨λ“ˆκ³Ό λŒ€μ‘° ν•™μŠ΅ λͺ©ν‘œλ₯Ό 톡해 인물 정보와 μŒμƒ‰ 정보λ₯Ό 효과적으둜 μ œμ–΄ν•¨μœΌλ‘œμ¨, κΈ°μ‘΄ 방법둠 λŒ€λΉ„ 일관성 μžˆλŠ” 인물 ν‘œν˜„κ³Ό μŒμƒ‰ 좩싀도λ₯Ό λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
λŒ€κ·œλͺ¨ κ³ ν’ˆμ§ˆ μ˜€λ””μ˜€-λΉ„λ””μ˜€ 데이터셋 κ΅¬μΆ•μ˜ μ€‘μš”μ„±: OmniCustom의 μ„±λŠ₯은 자체적으둜 κ΅¬μΆ•ν•œ λŒ€κ·œλͺ¨, κ³ ν’ˆμ§ˆ μ˜€λ””μ˜€-λΉ„λ””μ˜€ 인간 데이터셋에 크게 μ˜μ‘΄ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ λ°μ΄ν„°μ…‹μ˜ 확보 및 ꡬ좕은 μœ μ‚¬ν•œ 연ꡬ 및 κ°œλ°œμ— μžˆμ–΄ μ€‘μš”ν•œ μ„ ν–‰ κ³Όμ œκ°€ 될 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
윀리적 문제 및 μ•…μš© κ°€λŠ₯성에 λŒ€ν•œ κ³ λ €: λ³Έ κΈ°μˆ μ€ λ”₯νŽ˜μ΄ν¬μ™€ 같은 μ•…μš© κ°€λŠ₯성을 λ‚΄ν¬ν•˜κ³  μžˆμ–΄, 기술의 μ±…μž„κ° μžˆλŠ” μ‚¬μš©κ³Ό 윀리적 κ°€μ΄λ“œλΌμΈ λ§ˆλ ¨μ— λŒ€ν•œ 심도 μžˆλŠ” λ…Όμ˜κ°€ ν•„μš”ν•©λ‹ˆλ‹€.
β€’
μ‹€μ‹œκ°„ 생성 및 μƒν˜Έμž‘μš©μ„±: μ œλ‘œμƒ· λ°©μ‹μœΌλ‘œ μž‘λ™ν•˜μ§€λ§Œ, μ‹€μ œ μ‹€μ‹œκ°„ μƒν˜Έμž‘μš© 및 즉각적인 ν”Όλ“œλ°±μ΄ κ°€λŠ₯ν•œ μˆ˜μ€€μ˜ μ„±λŠ₯ μ΅œμ ν™”λŠ” ν–₯ν›„ 연ꡬ 과제둜 λ‚¨μ•„μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘