haebom
Sign In

Pro2Guard: Proactive Runtime Enforcement of LLM Agent Safety via Probabilistic Model Checking

작성자
  • Haebom
카테고리
Empty

저자

Haoyu Wang, Chris M. Poskitt, Jun Sun, Jiali Wei

개요

본 논문은 대규모 언어 모델(LLM) 에이전트의 불확실성으로 인한 안전 위험을 해결하기 위해, 사전 예방적 런타임 강화 프레임워크인 Pro2Guard를 제안합니다. Pro2Guard는 에이전트의 행동을 상징적 상태로 추상화하고, 실행 추적에서 이산 시간 마르코프 체인(DTMC)을 학습합니다. 런타임 시, 위험 상태에 도달할 확률을 예측하여 위험이 임계값을 초과하면 위반 발생 전에 개입합니다. 의미적 유효성 검사와 PAC 경계를 활용하여 통계적 신뢰성을 보장합니다. 가정용 에이전트와 자율 주행 시나리오에서의 실험 결과, Pro2Guard는 안전 위반을 효과적으로 예측하고 예방하는 것을 보여줍니다.

시사점, 한계점

•
시사점:
◦
LLM 에이전트의 안전 문제에 대한 새로운 접근 방식 제시 (사전 예방적 접근)
◦
기존 반응형 시스템의 한계(예측 불가능성, 장기적 의존성, 분포 변화) 극복
◦
실제 환경(가정용 에이전트, 자율 주행)에서의 효과적인 안전 강화 입증
◦
안전과 작업 성공률 사이의 균형 조절 가능성
•
한계점:
◦
DTMC 모델링의 정확성은 실제 에이전트 행동의 복잡성에 따라 제한될 수 있음.
◦
PAC 경계를 이용한 통계적 신뢰성 보장에도 불구하고, 모델의 근본적인 불확실성은 완전히 제거할 수 없음.
◦
고차원 상태 공간에서의 계산 복잡도 문제 발생 가능성.
◦
임계값 설정의 민감도: 임계값 설정에 따라 안전성과 작업 성공률 간의 trade-off가 발생할 수 있음.
PDF 보기
👍
Made with Slashpage