본 논문은 산업 전반의 예지보전(PHM)에 필수적인 잔여수명(RUL) 및 건전성상태(SOH) 추정을 위한 새로운 프레임워크인 RGPD(Reinforced Graph-Based Physics-Informed Neural Networks Enhanced with Dynamic Weights)를 제안한다. RGPD는 물리 기반 감독과 고급 시공간 학습을 결합하여, 그래프 합성곱 순환 네트워크(GCRN)와 그래프 어텐션 합성곱(GATConv)을 이용하여 노드 표현의 시간적 변화와 이웃 노드의 기여도를 동적으로 가중치를 부여하여 학습한다. 소프트 액터-크리틱(SAC) 모듈은 시공간 학습을 더욱 향상시키고, Q-학습 에이전트는 물리 기반 손실 항에 동적으로 가중치를 할당하여 실시간 산업 시스템 전반의 일반화를 개선하고 수동 조정의 필요성을 줄인다. 세 가지 다양한 산업 벤치마크 데이터셋에서 기존 최고 성능 모델을 능가하는 RUL 및 SOH 추정 성능을 보여준다.