haebom
Sign In
SafeVLA: Towards Safety Alignment of Vision-Language-Action Model via Constrained Learning
Created by
Haebom
Category
Empty
μ μ
Borong Zhang, Yuhao Zhang, Jiaming Ji, Yingshan Lei, Yishuai Cai, Josef Dai, Yuanpei Chen, Yaodong Yang
π‘ κ°μ
λ³Έ λ Όλ¬Έμ λ‘λ΄ μ μ± μΌλ‘ νμ©λ μ μλ Vision-Language-Action (VLA) λͺ¨λΈμ μ€μ λ°°ν¬ μ λ°μνλ μμ λ¬Έμ λ₯Ό ν΄κ²°νκ³ μ ν©λλ€. μ΄λ₯Ό μν΄ μμ μꡬμ¬νμ 체κ³μ μΌλ‘ λͺ¨λΈλ§νκ³ , λ€μν μν νλμ λ₯λμ μΌλ‘ λ°κ΅΄νλ©°, μ μ½μ΄ κ°ν΄μ§ κ°ννμ΅μ ν΅ν΄ VLA μ μ± μ μ μ½νκ³ , μ격ν νκ°λ₯Ό ν΅ν΄ μμ μ±μ 보μ₯νλ ν΅ν© μμ μ κ·Όλ²(ISA)μ μ μν©λλ€. ISAλ μ μ½ λ§λ₯΄μ½ν κ²°μ κ³Όμ (CMDP) ν¨λ¬λ€μμ νμ©νμ¬ μμ μνμ λν μ΅μ-μ΅λ κ΄μ μμ VLAλ₯Ό μ΅μ νν©λλ€.
π μμ¬μ λ° νκ³
β’
μ μλ ISA μ κ·Όλ²μ κΈ°μ‘΄ μ΅μ²¨λ¨ λ°©λ² λλΉ μμ μλ° λμ λΉμ©μ 83.58% κ°μμν€λ©΄μλ μμ μ±κ³΅λ₯ μ 3.85% λμ΄λ ν¨κ³Όμ μΈ μμ -μ±λ₯ νΈλ μ΄λμ€νλ₯Ό λ¬μ±ν©λλ€.
β’
VLA λͺ¨λΈμ μ₯κΈ°μ μΈ μνκ³Ό κ·Ήλ¨μ μΈ μ€ν¨ μλ리μ€λ₯Ό μνν μ μλ κ°λ ₯ν μμ 보μ₯ λ₯λ ₯μ κ°μΆκ² λ©λλ€.
β’
νμ΅λ μμ νλμ λ€μν λΆν¬ μΈ(out-of-distribution) κ΅λμ λν΄μλ κ²¬κ³ νκ² μΌλ°νλ©λλ€.
β’
λ³Έ μ°κ΅¬λ λͺ¨λ°μΌ μ‘°μκ³Ό κ°μ μ₯κΈ°μ μμ μ λμμΌλ‘ ν¨κ³Όμ±μ νκ°νμμΌλ©°, κ΄λ ¨ λ°μ΄ν°, λͺ¨λΈ, κ·Έλ¦¬κ³ μλ‘μ΄ λ²€μΉλ§ν¬ νκ²½μ 곡κ°ν©λλ€.
PDF 보기
Made with Slashpage