Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

RAG-targeted Adversarial Attack on LLM-based Threat Detection and Mitigation Framework

Created by
  • Haebom
Category
Empty

저자

Seif Ikbarieh, Kshitiz Aryal, Maanak Gupta

개요

IoT의 급속한 확장은 여러 산업에서 통신 및 운영 방식을 변화시키고 있지만, 공격 표면을 넓히고 보안 침해에 대한 취약성을 증가시키고 있습니다. 인공지능은 IoT 네트워크 보안에 가치 있는 솔루션이 되었으며, 대규모 언어 모델(LLM)은 네트워크 침입 탐지 시스템(NIDS)에서 자동화된 공격 행위 분석 및 완화 제안을 가능하게 합니다. 이러한 발전에도 불구하고, 이러한 시스템에서 LLM을 사용하면 공격 표면이 더욱 확장되어 프롬프트 주입 및 데이터 중독과 같은 취약점을 도입하여 전체 네트워크를 위험에 빠뜨립니다. 본 연구에서는 LLM 기반 IoT 공격 분석 및 완화 프레임워크를 공격하여 적대적 강건성을 테스트합니다. 공격 설명 데이터 세트를 구축하고 이를 사용하여 검색 증강 생성(RAG) 지식 기반을 손상시키는 단어 수준의 의미 보존적인 방해를 적용하는 표적 데이터 중독 공격을 수행합니다. 그런 다음, 기존 평가 기준을 사용하여 공격 전후 대상 모델인 ChatGPT-5 Thinking의 완화 응답을 비교하여 모델 성능에 대한 공격의 영향을 측정합니다. 결과는 작은 방해가 LLM 성능을 저하시키고, 관찰된 네트워크 트래픽 특징과 공격 행위 간의 연결을 약화시키며, 리소스 제약 장치에 대한 권장 완화의 구체성과 실용성을 감소시키는 것을 보여줍니다.

시사점, 한계점

시사점:
LLM 기반 IoT 공격 분석 및 완화 프레임워크는 데이터 중독 공격에 취약합니다.
작은 방해에도 LLM 성능이 저하될 수 있습니다.
공격은 네트워크 트래픽 특징과 공격 행위 간의 연결을 약화시킵니다.
공격은 리소스 제약 장치에 대한 완화의 구체성과 실용성을 감소시킵니다.
한계점:
특정 LLM(ChatGPT-5 Thinking) 및 공격 유형(표적 데이터 중독 공격)에 국한됩니다.
단어 수준의 방해에만 초점을 맞춥니다.
완화 전략에 대한 추가 연구가 필요합니다.
👍