haebom
Sign In
AsymTalker: Identity-Consistent Long-Term Talking Head Generation via Asymmetric Distillation
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Yuxin Lu, Qian Qiao, Jiayang Sun, Guibo Zhu, Min Cao
π‘ κ°μ
λ³Έ λ Όλ¬Έμ μ₯κΈ°μ μΈ κ³ νμ§μ μΌκ΅΄ μ λλ©μ΄μ μμ±μ μμ΄μ λ°μνλ μκ°-곡κ°μ λΆμΌμΉμ λμΌμ± λ리ννΈ λ¬Έμ λ₯Ό ν΄κ²°νλ AsymTalkerλ₯Ό μ μν©λλ€. μ μλ λ°©λ²μ Temporal Reference Encoding (TRE)μΌλ‘ μ μ μ΄λ―Έμ§μ μκ°μ μΌκ΄μ±μ κ°ννκ³ , Asymmetric Knowledge Distillation (AKD)λ₯Ό ν΅ν΄ νμ΅-μΆλ‘ λΆμΌμΉ μμ΄ μ₯κΈ°μ μΈ λμΌμ± μ μ§λ₯Ό λ¬μ±ν©λλ€. μ΄λ₯Ό ν΅ν΄ 600μ΄μ λ¬νλ κΈ΄ μμμμλ λμ μΆ©μ€λμ μΌκ΄μ±μ μ μ§νλ©° μ€μκ°μ κ°κΉμ΄ μλλ‘ μΌκ΅΄ μ λλ©μ΄μ μ μμ±ν©λλ€.
π μμ¬μ λ° νκ³
β’
μ₯κΈ° μμ μμ± μ λ°μνλ μκ°-곡κ°μ λΆμΌμΉμ λμΌμ± λ리ννΈ λ¬Έμ λ₯Ό ν¨κ³Όμ μΌλ‘ ν΄κ²°νλ μλ‘μ΄ μ κ·Όλ²μ μ μνμ΅λλ€.
β’
Teacher-Student ꡬ쑰λ₯Ό νμ©ν λΉλμΉ μ§μ μ¦λ₯ κΈ°λ²μ νμ΅ λ°μ΄ν° μμ‘΄μ±μ μ€μ΄κ³ μΆλ‘ μ±λ₯μ λμ΄λ λ° κΈ°μ¬νμ΅λλ€.
β’
600μ΄λΌλ λ§€μ° κΈ΄ μμμμλ κ³ νμ§μ κ²°κ³Όλ¬Όμ μμ±νλ©°, μ€μκ° μΆλ‘ μλ(66 FPS)λ₯Ό λ¬μ±νμ¬ μ€μ©μ±μ μ μ¦νμ΅λλ€.
β’
(νκ³μ λλ ν₯ν κ³Όμ ) λ Όλ¬Έμμ μ μλ ASKD κΈ°λ²μ Teacher λͺ¨λΈ νμ΅μ μ¬μ ν ground-truth λ°μ΄ν°κ° νμνλ©°, μ΄λ λκ·λͺ¨ λ°μ΄ν°μ κ΅¬μΆ λ° κ΄λ¦¬μ λΆλ΄μΌλ‘ μ΄μ΄μ§ μ μμ΅λλ€.
PDF 보기
Made with Slashpage