haebom
Sign In
Do Joint Audio-Video Generation Models Understand Physics?
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Zijun Cui, Xiulong Liu, Hao Fang, Mingwei Xu, Jiageng Liu, Zexin Xu, Weiguo Pian, Shijian Deng, Feiyu Du, Chenming Ge, Yapeng Tian
π‘ κ°μ
λ³Έ μ°κ΅¬λ 곡λ μ€λμ€-λΉλμ€ μμ± λͺ¨λΈμ΄ μ€μ 물리 λ²μΉμ μ΄ν΄νλμ§, μλλ©΄ λ¨μν κ·Έλ΄λ―ν κ²°κ³Όλ¬Όμ μμ±νλμ§λ₯Ό νκ°νκΈ° μν΄ AV-Phys BenchλΌλ μλ‘μ΄ λ²€μΉλ§ν¬λ₯Ό μ μν©λλ€. μ΄ λ²€μΉλ§ν¬λ λ€μν μ₯λ©΄ μ νκ³Ό 물리μ μΌκ΄μ±μ ν μ€νΈνλ©°, κΈ°μ‘΄ λͺ¨λΈλ€μ 물리μ μ΄ν΄λκ° μ¬μ ν λΆμ‘±ν¨μ 보μ¬μ€λλ€. νΉν, μ νμ΄ λ°μνλ μ₯λ©΄μ΄λ 물리μ μΌλ‘ μΌκ΄λμ§ μμ μμ²μ λν΄ μ±λ₯ μ νκ° λλλ¬μ§λ©°, μΈκ° νκ°μ μ μ¬ν κ²°κ³Όλ₯Ό λμΆνλ AV-Phys Agent νκ°μλ₯Ό ν¨κ» μκ°ν©λλ€.
π μμ¬μ λ° νκ³
β’
곡λ μ€λμ€-λΉλμ€ μμ± λͺ¨λΈμ μμ§ λ¬Όλ¦¬μ μμμ΄λ μ€μ μΈκ³μ μΌκ΄μ±μ μ λλ‘ μ΄ν΄νμ§ λͺ»νλ©°, μ΄λ λͺ¨λΈ κ°λ°μ μ€μν μ₯μ λ¬Όμ λλ€.
β’
μ₯λ©΄ μ ν(event/environment transition)κ³Ό κ°μ΄ μλμ μΈ μν©μμμ 물리μ μΌκ΄μ± μ μ§κ° νμ¬ λͺ¨λΈλ€μ ν΅μ¬μ μΈ μ½μ μ λλ€.
β’
μΈκ°μ νκ°μ μ μ¬ν μλ νκ°μ(AV-Phys Agent) κ°λ°μ ν₯ν 곡λ μ€λμ€-λΉλμ€ μμ± λͺ¨λΈ νκ°μ ν¨μ¨μ±μ λμΌ μ μμ΅λλ€.
β’
ν₯ν μ°κ΅¬λ λͺ¨λΈμ΄ 물리 λ²μΉμ λ κΉμ΄ μ΄ν΄νκ³ , 볡μ‘ν μ₯λ©΄ μ ν μμμλ μΌκ΄μ±μ μ μ§νλ©°, μΈκ°μ 물리μ μ§κ΄μ λ°λ₯΄λλ‘ κ°μ νλ λ° μ΄μ μ λ§μΆ°μΌ ν©λλ€.
PDF 보기
Made with Slashpage