haebom
Sign In
Continually Evolving Skill Knowledge in Vision Language Action Model
Created by
Haebom
Category
Empty
μ μ
Yuxuan Wu, Guangming Wang, Zhiheng Yang, Maoqing Yao, Brian Sheil, Hesheng Wang
π‘ κ°μ
λ³Έ λ Όλ¬Έμ μ¬μ νμ΅λ Vision-Language-Action (VLA) λͺ¨λΈμ ν¨μ¨μ μΈ μ§μ νμ΅ λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ μλ‘μ΄ μ§μ κΈ°λ° μ§μ λͺ¨λ°© νμ΅ (CIL) νλ μμν¬μΈ Stellar VLAλ₯Ό μ μν©λλ€. Stellar VLAλ λ€νΈμν¬ λ§€κ°λ³μλ₯Ό λλ¦¬μ§ μμΌλ©΄μ νμ€ν¬ ννκ³Ό νμ΅λ μ§μ 곡κ°μ 곡λμΌλ‘ μ΅μ ννμ¬ μ§μμ μ€μ€λ‘ λ°μ μν΅λλ€. λν, μ§μ κ΄κ³μ Top-K μλ―Έλ‘ μ μλ² λ©μ κΈ°λ°ν μ§μ μλ΄ μ λ¬Έκ° λΌμ°ν λ©μ»€λμ¦μ ν΅ν΄ λͺ¨λΈ ν¬κΈ° μ¦κ° μμ΄ νμ€ν¬ μ λ¬Ένλ₯Ό κ°λ₯νκ² ν©λλ€.
π μμ¬μ λ° νκ³
β’
κΈ°μ‘΄ VLA λͺ¨λΈμ μ§μ νμ΅ μ λ°μνλ λ§€κ°λ³μ μ¦κ° λλ μΈλΆ λͺ¨λ μ¬μ© λ¬Έμ λ₯Ό ν΄κ²°νμ¬ ν¨μ¨μ μΈ μ μμ κ°λ₯νκ² ν©λλ€.
β’
νμ€ν¬ ννκ³Ό μ§μ 곡κ°μ 곡λμΌλ‘ νμ΅ν¨μΌλ‘μ¨ λͺ¨λΈμ΄ μ€μ€λ‘ μ§μμ λ°μ μν€κ³ 보μ νλλ‘ ν©λλ€.
β’
νΉν κ³μΈ΅μ νμ€ν¬ νμ΅μ ν¨κ³Όμ μΈ TS-Stellar λͺ¨λΈμ 볡μ‘ν μ‘°μ μμ μμ λ°μ΄λ μ±λ₯μ 보μ λλ€.
β’
1% λ°μ΄ν° μ¬νλ§μΌλ‘λ κ°λ ₯ν μ±λ₯μ λ¬μ±νλ©°, μ€μ λ‘λ΄ νκ²½μμμ ν¨κ³Όμ μΈ μ§μ μ μ΄λ₯Ό μ μ¦νμ΅λλ€.
β’
ν₯ν μ°κ΅¬μμλ λμ± λ³΅μ‘νκ³ λ€μν νκ²½μμμ μΌλ°ν λ₯λ ₯ ν₯μ λ° μ€μκ° μ§μ νμ΅ κΈ°λ₯ κ°ν λ±μ κ³ λ €ν μ μμ΅λλ€.
PDF 보기
Made with Slashpage