기존의 상황적 다중 팔 밴딧(MAB) 알고리즘은 모든 팔에 걸쳐 장기적인 추세와 지역적 패턴을 효과적으로 포착하지 못하여 보상 구조가 빠르게 변하는 환경에서 최적이 아닌 성능을 보입니다. 또한, 변화하는 조건에 동적으로 적응하지 않는 정적 탐색률에 의존합니다. 이러한 한계를 극복하기 위해, 본 논문에서는 시간 복잡도를 줄이기 위한 새로운 비선형 구성 요소(적응형 k-Nearest Neighbors (k-NN))와 전역 및 지역 기반 어텐션 탐색 메커니즘을 통합한 하이브리드 밴딧 모델인 LNUCB-TA를 제안합니다. 본 접근 방식은 선형 및 비선형 추정 기법을 독창적으로 결합하여, 비선형 모듈이 보상 분산에 따라 k를 동적으로 조정하여 시공간 패턴 인식을 향상시킵니다. 이는 최적이 아닌 팔을 선택할 가능성을 줄이고 보상 추정 정확도와 계산 효율성을 향상시킵니다. 어텐션 기반 메커니즘은 과거 성능과 선택 빈도에 따라 팔을 순위를 매기고, 탐색률을 수동으로 조정할 필요 없이 실시간으로 탐색과 활용을 동적으로 조정합니다. 전역 어텐션(모든 팔을 집합적으로 평가)과 지역 어텐션(개별 팔에 집중)을 통합함으로써 LNUCB-TA는 시간적 및 공간적 복잡성에 효율적으로 적응합니다. 실험 결과, LNUCB-TA는 누적 및 평균 보상, 수렴 및 강건성 측면에서 다양한 탐색률에 걸쳐 최첨단 선형, 비선형 및 하이브리드 밴딧을 크게 능가합니다. 이론적 분석은 또한 하위 선형 후회 경계를 통해 신뢰성을 더욱 확인합니다.