본 논문은 심층 강화 학습에서의 표본 효율성 및 지역적 최적화 문제를 해결하기 위해, BiGAN(Bidirectional Generative Adversarial Networks) 기반의 신규성 기반 탐색 알고리즘인 Adventurer를 제안합니다. Adventurer는 BiGAN을 이용하여 상태의 신규성을 추정합니다. 방문한 상태의 분포로 훈련된 생성자는 방문한 상태 분포에서 나온 상태만 생성할 수 있으므로, 생성자가 특정 잠재 표현에서 입력 상태를 재구성하는 데 큰 재구성 오차가 발생하면 그 상태가 새로운 상태임을 의미합니다. 실험 결과, Adventurer는 Mujoco 로봇 조작 작업 및 Atari 게임과 같은 다양한 벤치마크 작업에서 경쟁력 있는 결과를 보여줍니다.