본 논문은 Vision-Language-Action (VLA) 모델의 적대적 공격 취약성을 다루며, 특히 보편적이고 이전 가능한 공격 방식에 초점을 맞춥니다. 기존 패치는 특정 모델에 과적합되고 블랙 박스 설정에서 실패하는 문제를 해결하기 위해, UPA-RFAS (Universal Patch Attack via Robust Feature, Attention, and Semantics)라는 프레임워크를 제안합니다. 이 프레임워크는 공유 특징 공간에서 단일 물리적 패치를 학습하며, 다양한 VLA 모델, 작업, 뷰포인트에 걸쳐 일관된 공격 성공률을 보입니다.