haebom
Sign In
Self-Improving World Modelling with Latent Actions
Created by
Haebom
Category
Empty
μ μ
Yifu Qiu, Zheng Zhao, Waylon Li, Yftah Ziser, Anna Korhonen, Shay B. Cohen, Edoardo M. Ponti
π‘ κ°μ
λ³Έ λ Όλ¬Έμ LLM λ° VLMμ μΆλ‘ λ° κ³νμ νμμ μΈ μλ λͺ¨λΈλ§(μν μ μ΄ μμΈ‘)μ νμ΅νκΈ° μν΄ κΈ°μ‘΄μ λΉμΌ μ‘μ λ μ΄λΈμ΄ νμν κΆ€μ λ°μ΄ν° λμ μν μ 보λ§μΌλ‘ νμ΅νλ SWIRL νλ μμν¬λ₯Ό μ μν©λλ€. SWIRLμ μ‘μ μ μ μ¬ λ³μλ‘ μ·¨κΈνμ¬ μλ°©ν₯ μλ λͺ¨λΈλ§(FWM)κ³Ό μλν λͺ¨λΈλ§(IDM)μ λ²κ°μ νμ΅μν€λ©°, κ° λͺ¨λΈμ λ°λ λͺ¨λΈμ λ‘κ·Έ νλ₯ μ 보μ μ νΈλ‘ μ¬μ©νμ¬ κ°ν νμ΅μΌλ‘ μ λ°μ΄νΈλ©λλ€.
π μμ¬μ λ° νκ³
β’
μ‘μ μ 보 μμ΄ μν μ 보λ§μΌλ‘λ μ μ©ν μλ λͺ¨λΈμ νμ΅ν μ μμμ μ μ¦νμ΅λλ€.
β’
FWMκ³Ό IDMμ μνΈ λ³΄μμ μΈ νμ΅ λ°©μμ ν΅ν΄ λͺ¨λΈμ μΌκ΄μ±κ³Ό μ€λͺ λ ₯μ λμμ΅λλ€.
β’
λ€μν νκ²½(μκ°, ν μ€νΈ)μμ κΈ°μ‘΄ λ°©λ²λ‘ λλΉ μ μλ―Έν μ±λ₯ ν₯μμ λ¬μ±νμ΅λλ€.
β’
볡μ‘ν νκ²½μ΄λ λΉμ μμ μΈ μν μ μ΄μ λν λͺ¨λΈμ κ²¬κ³ μ± λ° νμ₯μ±μ λν μΆκ° μ°κ΅¬κ° νμν©λλ€.
PDF 보기
Made with Slashpage