본 논문에서는 오프라인 강화학습(RL)에서 고차원 상태 공간의 데이터 손상 및 다중 요소 동시 손상 문제를 해결하기 위해 앰비언트 확산-유도 데이터 복구(ADG) 방법을 제안합니다. ADG는 확산 모델의 잡음 제거 기능을 활용하여 손상된 데이터를 복구합니다. 먼저, 부분적으로 손상된 데이터셋에서 학습 가능하도록 근사 분포로부터 앰비언트 잡음 제거 확산 확률 모델(DDPM)을 도입하고, 이를 통해 잡음과 깨끗한 데이터를 구분합니다. 그 후, 깨끗한 데이터셋으로 표준 DDPM을 학습시키고, 학습된 DDPM을 이용하여 손상된 데이터를 개선합니다. 다양한 벤치마크(MuJoCo, Kitchen, Adroit)에서 실험을 통해 ADG가 다양한 잡음 설정에서 오프라인 RL의 강건성을 향상시키고 최첨단 결과를 달성함을 보여줍니다. ADG는 어떤 오프라인 RL 알고리즘과도 통합될 수 있는 장점이 있습니다.