# Measuring the Permission Gate: A Stress-Test Evaluation of Claude Code's Auto Mode

### 저자

Zimo Ji, Zongjie Li, Wenyuan Jiang, Yudong Gao, Shuai Wang

### 💡 개요

본 연구는 Claude Code의 자동 모드라는 AI 코딩 에이전트의 권한 시스템을 독립적으로 평가했습니다. 이는 명확한 사용자 의도에도 불구하고 위험 수준이 불분명한 모호한 시나리오에 초점을 맞추어, 기존 보고된 수치보다 훨씬 높은 81.0%의 오탐율을 발견했습니다. 특히, 분류기가 평가하지 않는 프로젝트 내 파일 편집을 통해 위험한 작업이 수행되는 경우가 많아 권한 시스템의 효과적인 범위를 제한한다는 점을 밝혔습니다.

### 🔑 시사점 및 한계

- Claude Code 자동 모드는 명확한 사용자 의도와 달리 위험성이 불분명한 작업에 대해 기존 보고보다 훨씬 높은 오탐율을 보입니다.

- AI 코딩 에이전트는 쉘 접근 외에도 파일 편집을 통해 시스템 상태를 변경할 수 있으며, 현재 권한 시스템은 이러한 파일 편집을 효과적으로 감시하지 못합니다.

- 본 연구는 벤치마크 데이터셋(AmPermBench)을 사용하여 AI 권한 시스템의 취약점을 조명했지만, 실제 다양한 복잡성을 모두 반영하지는 못할 수 있습니다.

[PDF 보기](https://arxiv.org/pdf/2604.04978)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).