MedDreamer는 불규칙하고, 드물며, 노이즈가 많은 의료 데이터를 다루는 개인 맞춤형 치료 권장을 위한 2단계 모델 기반 강화 학습 프레임워크입니다. 기존 시스템의 한계인 데이터의 이산화 및 대치로 인한 시간적 역동성 왜곡 문제를 해결하기 위해, 적응적 특징 통합(AFI) 모듈을 갖춘 월드 모델을 사용하여 불규칙한 의료 데이터를 효과적으로 모델링합니다. 잠재적 상상을 통해 환자의 타당한 경로를 시뮬레이션하여 학습을 강화하고, 실제 및 상상된 경험을 혼합하여 정책을 개선합니다. 이는 최적이 아닌 과거의 결정을 넘어서면서도 임상 데이터를 기반으로 정책을 학습할 수 있게 합니다. 패혈증 및 기계적 환기(MV) 치료에 대한 대규모 EHR 데이터셋 두 개를 사용한 평가 결과, MedDreamer는 모델 기반 및 모델 비기반 기준 모델보다 임상 결과 및 오프-폴리시 지표에서 우수한 성능을 보였습니다.