본 논문은 기존의 다중 팔 밴딧 문제(multi-armed bandit problem)의 가정인 각 팔의 독립적이고 정상적인 보상이라는 전제를 벗어나, 실제 응용 분야에서 자주 발생하는 비정상적인 환경과 팔들 간의 상호 의존성을 고려한 새로운 밴딧 문제를 제시한다. 특히, 하나의 팔을 선택하는 것이 다른 팔의 미래 보상에 영향을 미치는 상황을 모델링하기 위해, 알려지지 않은 대칭적이고 양의 준정부호 상호 작용 행렬을 통해 팔 손실의 역학을 제어하는 영향력 있는 밴딧 문제(influential bandit problem)를 제안한다. 이 문제에 대한 두 가지 후회 하한 경계(regret lower bound)를 제시하고, 제안하는 LCB(Lower Confidence Bound) 기반 알고리즘을 통해 $O(KT \log T)$의 후회 상한 경계를 달성함을 보인다. 합성 및 실제 데이터셋을 이용한 실험을 통해 제안된 알고리즘의 우수성을 검증한다.