본 논문은 활성 순차적 가설 검정 문제(순수 탐색)을 연구합니다. 이 문제는 의사결정 문제의 기저에 있는 올바른 가설을 효율적으로 식별하기 위해 데이터 수집 과정을 적극적으로 제어하는 것을 목표로 합니다. 기존 강화학습(RL) 기반 방법은 관련 정보 구조가 부적절하게 표현될 때 성능이 저조하고, 최적 팔 식별(BAI) 기법과 같은 더 복잡한 방법은 고안하기 어렵고 일반적으로 명시적인 모델링 가정에 의존합니다. 본 논문에서는 이러한 한계를 해결하기 위해, Transformer를 사용하여 경험으로부터 직접 탐색 전략을 학습하는 컨텍스트 내 순수 탐색(ICPE) 방법을 제시합니다. ICPE는 사전 가정 없이 지도 학습과 강화 학습을 결합하여 관련 작업 간의 잠재 구조를 식별하고 활용합니다. 다양한 합성 및 반합성 벤치마크에 대한 수치 결과는 결정적, 확률적 및 구조적 설정에서 ICPE의 강력한 성능을 보여줍니다. 이러한 결과는 ICPE가 순전히 심층 학습 기법만을 사용하여 최적의 인스턴스 종속 알고리즘과 일치하는 능력을 보여주며, 데이터 효율적인 탐색에 대한 실용적이고 일반적인 접근 방식임을 시사합니다.