적응적 탐험 방법은 탐험과 활용을 번갈아 가며 복잡한 정책을 학습하는 방법을 제안합니다. 이러한 방법에서 중요한 질문은 탐험과 활용을 전환하는 적절한 시점을 결정하는 것입니다. 이 논문에서는 불확실성을 사용하여 이 문제를 원칙적으로 해결하는 일반적인 적응적 탐험 프레임워크를 제시합니다. 이 프레임워크는 이전의 적응적 탐험 접근 방식을 특수한 경우로 포함하며, 내재적 동기 부여 또는 인식적 불확실성 기반 탐험 방법에서 사용되는 메커니즘을 포함하여 원하는 불확실성 측정 메커니즘을 통합할 수 있습니다. 실험을 통해 이 프레임워크가 여러 MuJoCo 환경에서 표준 탐험 방법보다 우수한 적응적 탐험 전략을 생성함을 입증했습니다.