본 논문은 순수 탐색 (active sequential hypothesis testing) 문제, 즉 새로운 작업에 대해 학습자가 환경에서 데이터를 적응적으로 수집하여 기본적으로 올바른 가설을 효율적으로 결정하는 문제를 연구한다. 다중 손실 밴딧 문제에서 최적의 팔을 식별하는 작업 (BAI, Best-Arm Identification)과 일반화된 검색 문제를 예시로 제시하며, 관측 이력을 쿼리 동작 및 예측된 가설에 매핑하기 위해 Transformer를 메타 훈련하는 In-Context Pure Exploration (ICPE)를 소개한다. ICPE는 추론 시에 매개변수 업데이트 없이 새로운 작업에 대한 증거를 적극적으로 수집하고 참 가설을 추론한다. BAI 및 일반화된 검색을 포함한 결정론적, 확률론적 및 구조화된 벤치마크에서 ICPE는 정보 구조에 대한 명시적인 모델링 없이 적응형 기반선과 경쟁력을 보였다.