본 논문은 기업 환경에서 에이전트형 AI 시스템의 보안을 위한 동적이고 실행 가능한 프레임워크를 제시한다. 모델, 오케스트레이터, 도구, 데이터 간의 상호 작용에서 발생하는 안전 및 보안의 새로운 측면을 강조하며, 사용자 안전 관점에서 새로운 에이전트형 위험 식별 방법을 제안한다. 도구 오용, 연쇄적인 액션 체인, 의도하지 않은 제어 증폭 등 고유한 에이전트형 위험을 통합하는 운영 에이전트형 위험 분류 체계를 정의하고, 보조 AI 모델 및 에이전트와 사람의 감독을 활용하여 맥락적 위험 관리, 발견, 평가 및 완화를 수행하는 동적 프레임워크를 제시한다. 또한, AI 기반 레드팀을 통한 위험 발견을 다루며, NVIDIA의 AI-Q 연구 조교를 사례 연구로 사용하여 프레임워크의 효과를 입증하고, 10,000개 이상의 공격 및 방어 실행 추적을 포함하는 데이터 세트를 공개하여 연구 발전에 기여한다.