# DeEscalWild: A Real-World Benchmark for Automated De-Escalation Training with SLMs

### 저자

Md Hasebul Hasan, Krity Haque Charu, Eshwara Prasad Sridhar, Shuchisnigdha Deb, Mohammad A. Islam

### 💡 개요

본 논문은 경찰관의 효과적인 비상 상황 해제 훈련을 위한 현실적인 벤치마크 데이터셋인 DeEscalwild를 제안합니다. LLM의 높은 연산량을 극복하기 위해 SLM을 활용하고자 했으나, 관련 데이터 부족 문제를 해결하기 위해 실제 경찰-시민 상호작용 영상에서 추출 및 정제된 1,500개의 시나리오로 구성된 대규모 데이터셋을 구축했습니다. 이 데이터셋으로 학습된 SLM은 다양한 평가 지표에서 뛰어난 성능을 보여, 경량화된 엣지 디바이스에서도 효과적인 훈련 시스템 구축 가능성을 제시합니다.

### 🔑 시사점 및 한계

- **현실 기반 훈련 데이터셋 구축:** 실제 사건에서 추출된 고품질 데이터셋은 공공 안전 분야에서 AI 기반 훈련 시스템 개발의 중요한 기반이 될 수 있습니다.

- **SLM의 잠재력 입증:** 연산량이 적은 SLM도 특정 도메인에 최적화된 데이터를 통해 범용 LLM에 버금가거나 능가하는 성능을 낼 수 있음을 보여주었습니다.

- **엣지 컴퓨팅에서의 훈련 시스템 가능성:** 낮은 지연 시간과 개인 정보 보호를 고려한 엣지 디바이스에서의 실시간 훈련 시스템 구축 가능성을 열었습니다.

- **데이터의 편향성 및 일반화:** 'in-the-wild' 데이터의 특성상 특정 상황이나 상호작용 패턴에 편향될 가능성이 있으며, 다양한 인종, 배경, 상황에 대한 일반화 성능은 추가 연구가 필요합니다.

[PDF 보기](https://arxiv.org/pdf/2604.13075)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
