본 논문은 실세계 AI 기반 시스템의 의사결정 기반 공격에 대한 취약성을 다룹니다. 기존의 강건성 평가는 방어 시스템에 대한 완전한 지식을 활용하는 적응형 공격에 의존하지만, 이는 실제 상황을 완벽히 반영하지 못합니다. 본 연구는 공격과 방어 모두에 적응성 개념을 확장하여 상호 작용을 통한 상호 학습의 이점을 보여줍니다. 경쟁 게임으로 구성된 블랙박스 공격 및 방어를 적응적으로 최적화하기 위한 프레임워크를 제시합니다. 강건성을 신뢰성 있게 평가하기 위해 현실적이고 최악의 경우 공격에 대한 평가가 필수적입니다. 따라서 강화학습(RL)을 사용하여 공격 및 회피 전략을 향상시키고, 방어에도 동일한 원리를 적용하여 개별적으로 그리고 다중 에이전트 관점에서 공동으로 평가합니다. 시스템 응답을 동적으로 제어하는 능동적 방어가 의사결정 기반 공격에 대한 모델 강화에 필수적인 보완책임을 밝히고, 이러한 방어는 적응형 공격으로 회피될 수 있으며, 이는 방어 또한 적응형이어야 함을 시사합니다. 광범위한 이론적 및 실험적 조사를 통해 적응형 적대자는 블랙박스 AI 기반 시스템에 심각한 위협이 되며, 이로 인해 군비 경쟁이 재점화됨을 확인합니다. 본 연구의 접근 방식은 최첨단 블랙박스 공격 및 방어를 능가하며, 실제 배포된 ML 기반 시스템의 강건성에 대한 효과적인 통찰력을 제공합니다.