본 논문은 대규모 LoRaWAN 네트워크에서 패킷 전달률(PDR)과 에너지 효율(EE)과 같은 상충되는 지표들을 동적으로 전송 매개변수(주파수, 확산 계수, 전송 전력)를 할당하여 최적화하는 문제를 다룬다. 기존 방법들은 단일 지표에 초점을 맞추거나 동적 채널 환경에 대한 적응력이 부족하여 최적이 아닌 성능을 보이는 한계를 지닌다. 이를 해결하기 위해, 논문에서는 PDR-EE 간의 절충점을 지능적으로 찾는 두 가지 온라인 학습 기반 자원 할당 프레임워크를 제안한다. 첫 번째 제안인 D-LoRa는 조합형 다중 무장 밴딧 문제로 모델링된 완전 분산 프레임워크로, 매개변수 선택을 분해하고 분리된 보상 함수를 사용하여 학습 복잡도를 크게 줄이고 노드가 네트워크 역동성에 자율적으로 적응할 수 있도록 한다. 성능을 더욱 향상시키기 위해, 경량 중앙 집중식 초기화 단계를 통합하여 일회성 준 최적 채널 할당 및 액션 공간 가지치기를 수행하여 후속 분산 학습을 가속화하는 하이브리드 프레임워크인 CD-LoRa를 제안한다. 광범위한 시뮬레이션과 실제 현장 실험을 통해 제안된 프레임워크의 우수성을 보여주며, D-LoRa는 비정상 환경에서, CD-LoRa는 정상 상태에서 가장 빠른 수렴을 달성함을 확인하였다. 실제 배포에서도 기존 방법보다 PDR을 최대 10.8%, EE를 최대 26.1% 향상시켜 확장 가능하고 효율적인 LoRaWAN 네트워크에 대한 실용성을 확인했다.