Agent2Agent Threats in Safety-Critical LLM Assistants: A Human-Centric Taxonomy

Created by

Haebom

저자

Lukas Stappen, Ahmet Erkan Turan, Johann Hagerer, Georg Groh

💡 개요

본 논문은 자동차에 통합되는 LLM 기반 대화형 에이전트가 야기하는 새로운 보안 위협을 다룬다. 기존 AI 보안 프레임워크의 한계를 지적하며, 자산과 공격 경로를 분리하는 새로운 위협 모델링 프레임워크인 AgentHeLLM을 제안한다. 이를 통해 인간 중심의 자산 분류와 정식 그래프 기반 모델을 활용하여 다단계 위협을 자동 탐색하는 도구를 개발하여 실질적인 적용 가능성을 보여준다.

🔑 시사점 및 한계

•

안전이 중요한 시스템에서 LLM 에이전트 간의 상호 작용으로 발생하는 위협을 체계적으로 분석하고 모델링할 수 있는 새로운 방법론을 제시한다.

•

인간 중심의 자산 분류와 명확한 공격 경로 구분을 통해 안전한 AI 시스템 설계를 위한 중요한 통찰을 제공한다.

•

제안된 도구는 다단계 위협 발견 자동화를 통해 LLM 기반 안전 시스템의 보안 강화에 기여할 수 있다.

•

프레임워크의 완전한 검증 및 실제 차량 환경에서의 광범위한 테스트가 추가적으로 필요하다.

PDF 보기

Made with Slashpage