Vision-Language Model (VLM) 기반의 컴퓨터 에이전트가 모바일 플랫폼과 같은 디지털 환경에서 인간과 유사한 능력을 보여주고 있지만, 시스템 손상 및 개인 정보 유출과 같은 안전 문제의 가능성이 제기되고 있습니다. 이러한 안전 문제를 탐지하는 것은 어려운 과제이며, 이에 대한 연구를 위해 동적 샌드박스 환경인 MobileRisk-Live와 안전 감지 벤치마크를 소개합니다. 또한, Formal Verifier를 통한 시스템 수준 위반 탐지와 VLM 기반 Contextual Judge를 통한 문맥적 위험 평가를 결합한 하이브리드 안전 탐지 프레임워크인 OS-Sentinel을 제안합니다. OS-Sentinel은 기존 접근 방식보다 10%-30% 성능 향상을 보이며, 더 안전하고 신뢰할 수 있는 자율 모바일 에이전트 개발에 기여할 수 있습니다.
시사점, 한계점
•
시사점:
◦
MobileRisk-Live 환경과 안전 감지 벤치마크를 통해 모바일 에이전트 안전 연구의 기반을 마련함.
◦
OS-Sentinel 프레임워크는 시스템 수준 위반과 문맥적 위험을 효과적으로 탐지하여 기존 방식 대비 성능 향상을 보임.