본 논문은 생존율이 중요한 임상 환경에서 개별 환자 특성에 적응하는 순차적 치료 결정을 위한 체계적인 접근 방식인 동적 치료 체계(DTRs)를 다룬다. 검열된 데이터와 관련된 복잡성을 해결하기 위해 검열 인식 트리 기반 강화 학습(CA-TRL)이라는 새로운 프레임워크를 제시한다. 관찰 데이터로부터 효과적인 DTR을 학습하는 방법을 탐구하며, 증강 역확률 가중치(AIPW)와 검열 인식 수정을 통해 기존 트리 기반 강화 학습 방법을 향상시켜 강력하고 해석 가능한 치료 전략을 제공한다. 광범위한 시뮬레이션과 SANAD 간질 데이터 세트를 사용한 실제 응용을 통해 그 효과를 보여주며, 제한된 평균 생존 시간(RMST)과 의사결정 정확도와 같은 주요 지표에서 최근 제안된 ASCL 방법보다 우수한 성능을 보였다. 다양한 의료 환경에서 개인화되고 데이터 기반의 치료 전략을 발전시키는 데 한 걸음 더 나아간 연구이다.