본 논문은 대규모 언어 모델(LLM) 기반 에이전트의 안전성 문제를 해결하기 위해, 경량의 도메인 특화 언어인 AgentSpec을 제안합니다. AgentSpec은 트리거, 술어, 실행 메커니즘을 통합한 구조적 규칙을 정의하여 에이전트가 미리 정의된 안전 경계 내에서 작동하도록 합니다. 코드 실행, 물리적 에이전트, 자율 주행 등 다양한 도메인에서 AgentSpec을 구현하여 그 적응성과 효과를 입증하였으며, 평가 결과 코드 에이전트의 경우 90% 이상의 안전하지 않은 실행을 방지하고, 물리적 에이전트의 경우 모든 위험 행동을 제거하며, 자율 주행 차량의 경우 100% 준수를 달성했습니다. AgentSpec은 해석 가능성, 모듈성, 효율성을 결합하여 다양한 애플리케이션에서 LLM 에이전트 안전을 강화하는 실용적이고 확장 가능한 솔루션을 제공합니다. 또한, LLM을 사용하여 규칙 생성을 자동화하고 그 효과를 평가하였으며, OpenAI o1을 사용한 평가 결과 물리적 에이전트의 경우 정확도 95.56%, 재현율 70.96%를 달성하였고, 위험 코드의 87.26%를 성공적으로 식별했으며, 자율 주행 차량의 경우 8가지 시나리오 중 5가지에서 법 위반을 방지했습니다.