본 논문은 항공기 착륙 문제(ALP)에 대한 새로운 심층 강화 학습(DRL) 프레임워크를 제시합니다. 기존의 운영 연구 알고리즘 및 메타 휴리스틱 기반 방법들이 실시간 재스케줄링 및 계산 확장성 측면에서 한계를 보이는 것과 달리, 본 논문에서는 그래프 신경망과 액터-크리틱 아키텍처를 결합한 DRL 프레임워크를 제안합니다. 핵심 기여는 항공기 간의 시간적 및 공간적 관계를 효율적으로 포착하는 그래프 기반 상태 표현, 다중 경쟁 목표를 처리하도록 설계된 특수 액터-크리틱 아키텍처, 그리고 안전 제약 조건을 유지하면서 효율적인 자원 활용을 보장하는 활주로 균형 전략입니다. 실험 결과, 제안된 방법은 기존의 Mixed Integer Programming (MIP)에 비해 계산 시간을 99.95% 단축하고, 선착순(FCFS) 방법에 비해 활주로 처리량을 38% 향상시키는 경쟁력 있는 성능을 보였으며, 재훈련 없이도 실시간 재스케줄링이 가능하다는 점을 강조합니다.