본 논문은 실제 분산형 사물 인터넷(IoT) 시스템에서 심층 강화 학습(DRL) 모델을 훈련시키는 새로운 프레임워크를 제안합니다. 기존 연구들이 복잡한 의사결정 과제 처리에 강점을 가진 DRL을 자원 할당에 효율적으로 적용하는 데 집중했지만, 실제 데이터를 사용한 훈련은 부족했습니다. 본 논문에서 제안하는 프레임워크는 IoT 기기가 DRL 기반 방법을 사용하여 통신 채널을 선택하고, 실제 데이터 전송을 통해 얻은 확인(ACK) 정보를 피드백으로 DRL 모델을 훈련합니다. 프레임 성공률(FSR)을 기준으로 성능 평가를 수행하여 제안된 프레임워크의 실현 가능성과 효과를 보여줍니다.