본 논문은 에너지 및 대역폭과 같은 변동하는 자원 제약을 관리하면서 실시간으로 응답해야 하는 사물 인터넷(IoT) 시스템에 초점을 맞추고 있습니다. 기존 방법들이 시간에 따라 변화하는 운영 제약 조건을 다루는 데 어려움을 겪는다는 점을 지적하며, 동적 운영 한계를 갖는 IoT 애플리케이션에 맞춤화된 새로운 예산 다중 무장 밴딧(Budgeted Multi-Armed Bandit) 프레임워크를 제안합니다. 이 모델은 학습 초기에는 제약 위반을 제한적으로 허용하고 시간이 지남에 따라 점진적으로 엄격한 준수를 시행하는 감소하는 위반 예산(decaying violation budget)을 도입합니다. 시간에 따라 변화하는 제약 조건에 대한 성능 최적화와 준수 간의 균형을 적응적으로 맞추는 예산 상한 신뢰 구간(Budgeted Upper Confidence Bound, UCB) 알고리즘을 제시하고, Budgeted UCB가 학습 기간 동안 준선형 후회(sublinear regret)와 로그 제약 위반(logarithmic constraint violations)을 달성한다는 이론적 보장을 제공합니다. 무선 통신 환경에서의 광범위한 시뮬레이션을 통해 제안된 방법이 표준 온라인 학습 방법보다 더 빠른 적응과 더 나은 제약 조건 만족을 달성함을 보여주며, 적응적이고 자원 인식적인 IoT 시스템 구축을 위한 프레임워크의 잠재력을 강조합니다.