# The Effects of Visual Priming on Cooperative Behavior in Vision-Language Models

### 저자

Kenneth J. K. Ong

### 💡 개요

본 연구는 비전-언어 모델(VLM)이 의사결정 시스템에 통합됨에 따라 시각적 입력이 VLM의 행동에 미치는 영향을 탐구합니다. Iterated Prisoner's Dilemma (IPD) 시나리오를 통해 친절/도움 또는 공격성/이기심을 묘사하는 이미지와 색상으로 구분된 보상 행렬이 VLM의 협력적 행동에 미치는 영향을 조사했으며, 여러 최첨단 VLM에서 이러한 시각적 정보가 VLM의 의사결정 패턴을 변화시킬 수 있음을 발견했습니다.

### 🔑 시사점 및 한계

- VLM의 행동은 시각적 정보(이미지 내용 및 색상 단서)에 의해 상당한 영향을 받을 수 있으며, 이는 다양한 VLM 모델에 걸쳐 다른 취약성과 완화 효과를 보입니다.

- 프롬프트 수정, Chain of Thought (CoT) 추론, 시각 토큰 감소와 같은 완화 전략은 시각적 편향을 줄이는 데 잠재적인 효과가 있음을 시사합니다.

- VLM의 구조적 및 훈련상의 차이가 서로 다른 행동 반응을 유발할 수 있으며, 이는 시각적으로 풍부하고 안전이 중요한 환경에서 VLM을 배포할 때 견고한 평가 프레임워크의 중요성을 강조하며, 향후 추가적인 연구가 필요한 영역입니다.

---

[PDF 보기](https://arxiv.org/pdf/2604.27953)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).