본 논문은 기존의 확률적 밴딧(stochastic bandit)에 대한 적대적 공격이 비현실적인 가정(예: 라운드별 보상 조작, 무한대의 섭동)에 의존하여 실제 시스템과의 관련성이 제한적이라는 점을 지적합니다. 따라서 더 현실적인 위협 모델인 "가짜 데이터 주입(Fake Data Injection)"을 제안합니다. 이 모델은 제한된 수의 유계 가짜 피드백 샘플만 학습자의 기록에 주입할 수 있다는 제약 조건을 반영하며, 합법적인 상호 작용을 시뮬레이션합니다. 본 논문에서는 이 모델 하에서 보상 값에 대한 크기 제약과 데이터 주입 시점 및 빈도에 대한 시간적 제약을 명시적으로 고려하는 효율적인 공격 전략을 설계합니다. 이론적 분석을 통해 제안된 공격이 상한 신뢰 구간(UCB) 및 톰슨 샘플링 알고리즘을 거의 모든 라운드에서 목표 암(arm)을 선택하도록 유도하면서 하위 선형 공격 비용만 발생시킬 수 있음을 보여줍니다. 합성 및 실제 데이터 세트에 대한 실험을 통해 제안된 전략의 효과를 검증하고, 실제 적대적 시나리오에서 널리 사용되는 확률적 밴딧 알고리즘의 취약성을 드러냅니다.