본 논문은 무선 통신 시스템에서 동적 자원 할당을 위한 심층 강화 학습(DRL) 알고리즘의 적용을 조사합니다. 기지국, 다중 안테나 및 사용자 장비를 포함하는 환경을 구축하고, RLlib 라이브러리를 사용하여 DQN 및 PPO와 같은 다양한 DRL 알고리즘을 적용합니다. 다양한 학습률과 스케줄링 정책의 영향에 중점을 두고 자원 할당 최적화 능력을 기반으로 알고리즘을 비교합니다. 연구 결과는 알고리즘과 학습률의 선택이 시스템 성능에 상당한 영향을 미치며, DRL이 기존 방법보다 더 효율적인 자원 할당을 제공함을 보여줍니다.