SafeVLA: Towards Safety Alignment of Vision-Language-Action Model via Constrained Learning

Created by

Haebom

저자

Borong Zhang, Yuhao Zhang, Jiaming Ji, Yingshan Lei, Yishuai Cai, Josef Dai, Yuanpei Chen, Yaodong Yang

💡 개요

본 논문은 로봇 정책으로 활용될 수 있는 Vision-Language-Action (VLA) 모델의 실제 배포 시 발생하는 안전 문제를 해결하고자 합니다. 이를 위해 안전 요구사항을 체계적으로 모델링하고, 다양한 위험 행동을 능동적으로 발굴하며, 제약이 가해진 강화학습을 통해 VLA 정책을 제약하고, 엄격한 평가를 통해 안전성을 보장하는 통합 안전 접근법(ISA)을 제안합니다. ISA는 제약 마르코프 결정 과정(CMDP) 패러다임을 활용하여 안전 위험에 대한 최소-최대 관점에서 VLA를 최적화합니다.

🔑 시사점 및 한계

•

제안된 ISA 접근법은 기존 최첨단 방법 대비 안전 위반 누적 비용을 83.58% 감소시키면서도 작업 성공률을 3.85% 높이는 효과적인 안전-성능 트레이드오프를 달성합니다.

•

VLA 모델은 장기적인 위험과 극단적인 실패 시나리오를 완화할 수 있는 강력한 안전 보장 능력을 갖추게 됩니다.

•

학습된 안전 행동은 다양한 분포 외(out-of-distribution) 교란에 대해서도 견고하게 일반화됩니다.

•

본 연구는 모바일 조작과 같은 장기적 작업을 대상으로 효과성을 평가하였으며, 관련 데이터, 모델, 그리고 새로운 벤치마크 환경을 공개합니다.

PDF 보기

Made with Slashpage