# Is VLA Reasoning Faithful? Probing Safety of Chain-of-Causation

### 저자

Nicanor Mayumu, Xiaoheng Deng, Patrick Mukala

### 💡 개요

본 연구는 Vision-Language-Action (VLA) 운전 모델의 추론 충실도를 체계적으로 분석한 최초의 연구입니다. 다양한 실제 물리적 운전 시나리오에서 300건의 추론 결과를 분석한 결과, 모델이 생성하는 자연어 설명과 궤적이 실제 상황과 상당 부분 일치하지 않음을 발견했습니다. 특히, 인과 사슬(Chain-of-Causation) 추론이 현실을 정확히 반영하는 비율은 절반 이하이며, 보행자 감지 오류 및 시각적 교란에 대한 취약성이 높게 나타났습니다.

### 🔑 시사점 및 한계

- VLA 모델의 추론 과정에서 생성되는 자연어 설명이 실제 행동이나 환경 상황과 항상 일치하는 것은 아니며, 모델의 안전성을 보장하기 위해 추론 충실도에 대한 철저한 검증이 필요합니다.

- 보행자 감지 오류와 시각적 변화에 대한 낮은 견고성은 자율 주행 시스템의 실질적인 안전성에 대한 우려를 제기하며, 이를 개선하기 위한 노력이 중요합니다.

- 본 연구는 정보 이론적 관점에서 충실도를 정량화하고, 구체적인 검증 기준을 제시함으로써 향후 VLA 모델의 안전성 평가 및 개선 방향에 대한 중요한 기반을 제공합니다.

---

[PDF 보기](https://arxiv.org/pdf/2605.17268)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
