본 논문은 기존의 비현실적인 가정(라운드별 보상 조작 및 무한대의 섭동)에 의존하는 확률적 밴딧에 대한 적대적 공격 연구의 한계를 지적하고, 더욱 현실적인 위협 모델인 "가짜 데이터 주입(Fake Data Injection)"을 제안합니다. 이 모델은 제한된 수의 경계가 있는 가짜 피드백 샘플만 학습자의 기록에 주입할 수 있다는 제약을 반영하여 실제 상호작용을 모방합니다. 본 논문에서는 이 모델 하에서 보상 값에 대한 크기 제약과 데이터 주입 시점 및 빈도에 대한 시간적 제약을 명시적으로 고려한 효율적인 공격 전략을 설계합니다. 이론적 분석을 통해 이러한 공격이 UCB와 Thompson Sampling 알고리즘을 속여 거의 모든 라운드에서 목표 암을 선택하게 만들면서도 하위 선형의 공격 비용만 발생시킬 수 있음을 보여줍니다. 합성 및 실제 데이터셋에 대한 실험을 통해 제안된 전략의 효과를 검증하고, 실제 적대적 시나리오에서 널리 사용되는 확률적 밴딧 알고리즘의 취약성을 드러냅니다.