haebom
Sign In
Continually Evolving Skill Knowledge in Vision Language Action Model
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Yuxuan Wu, Guangming Wang, Zhiheng Yang, Tianchen Deng, Maoqing Yao, Brian Sheil, Hesheng Wang
π‘ κ°μ
λ³Έ λ Όλ¬Έμ Vision-Language-Action (VLA) λͺ¨λΈμ ν¨μ¨μ μΈ μ§μ νμ΅(continual learning) λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ νλΌλ―Έν° μ¦κ° μμ΄ μ§μ κΈ°λ°μ μ§μ νμ΅ νλ μμν¬μΈ Stellar VLAλ₯Ό μ μνλ€. Stellar VLAλ νμ€ν¬ ννκ³Ό νμ΅λ μ§μ 곡κ°μ 곡λμΌλ‘ μ΅μ ννμ¬ μ§μ μ체μ μ μ§μ μ§νλ₯Ό κ°λ₯νκ² νλ©°, μ΄λ₯Ό ν΅ν΄ νμ€ν¬ μ λ¬Ένλ₯Ό λ¬μ±νλ€. LIBERO λ²€μΉλ§ν¬ μ€νμμ 1%μ λ°μ΄ν°λ§ μ¬μ¬μ©νκ³ λ κΈ°μ‘΄ VLA λ° μ§μ νμ΅ κΈ°λ² λλΉ μ°μν μ±λ₯μ μ μ¦νλ€.
π μμ¬μ λ° νκ³
β’
VLA λͺ¨λΈμμ νλΌλ―Έν° μλ₯Ό λλ¦¬μ§ μκ³ λ μ§μμ μΈ μ§μ νμ΅ λ° νμ€ν¬ μ μμ΄ κ°λ₯ν¨μ 보μ¬μ€λ€.
β’
κ³μΈ΅μ νμ€ν¬ ꡬ쑰λ₯Ό ν¨κ³Όμ μΌλ‘ λ€λ£° μ μλ TS-Stellar λ³νμ ν΅ν΄ 볡μ‘ν λ‘λ΄ μ‘°μ νμ€ν¬μμμ μ±λ₯ ν₯μμ κΈ°λν μ μλ€.
β’
μ€μ λ‘λ΄ νκ²½μμμ κ²μ¦μ ν΅ν΄ μ μλ λ°©λ²λ‘ μ μΌλ°ν λ° μ μ΄ νμ΅ λ₯λ ₯μ νμΈνμλ€.
β’
ν₯ν μ°κ΅¬μμλ λ λ€μν μ’ λ₯μ νμ€ν¬μ 볡μ‘ν νκ²½μ λν Stellar VLAμ νμ₯ λ° μ±λ₯ μ΅μ νκ° νμνλ€.
PDF 보기
Made with Slashpage