본 논문은 부분적으로 관측 가능한 마르코프 결정 과정(POMDP) 프레임워크를 기반으로 하는 양자 네트워크 라우팅 기법을 제시한다. 동적 양자 시스템에서 부분 관측 가능성, 디코히어런스, 확장성 문제를 해결하기 위해 신념 상태 계획과 그래프 신경망(GNN)을 결합한다. 얽힘 저하 및 시간에 따라 변하는 채널 노이즈를 포함한 복잡한 양자 네트워크 동역학을 저차원 특징 공간으로 인코딩하여 효율적인 신념 업데이트와 확장 가능한 정책 학습을 가능하게 한다. 핵심은 얽힌 링크의 그래프 구조 표현을 처리하여 라우팅 정책을 학습하는 하이브리드 GNN-POMDP 아키텍처와 강력한 의사결정을 위해 POMDP 신념 업데이트와 GNN 출력을 융합하는 노이즈 적응 메커니즘이다. 신념 수렴, 정책 개선 및 노이즈에 대한 강건성을 보장하는 이론적 분석을 제공한다. 최대 100개 노드의 시뮬레이션된 양자 네트워크에 대한 실험은 특히 높은 디코히어런스 및 비정상 상태에서 최첨단 기준선과 비교하여 라우팅 충실도 및 얽힘 전달률을 크게 향상시킨다는 것을 보여준다.