Este artículo estudia el problema de las pruebas de hipótesis secuenciales activas (AST), donde un estudiante recopila datos del entorno de forma adaptativa para determinar eficientemente una hipótesis fundamentalmente correcta para una nueva tarea. Presentamos ejemplos de la tarea de Identificación del Mejor Brazo (BAI) en el problema del bandido con múltiples pérdidas y el problema de búsqueda generalizada. Presentamos la Exploración Pura en Contexto (ICPE), que metaentrena un Transformador para mapear el historial de observaciones con el comportamiento de la consulta y las hipótesis predichas. ICPE recopila activamente evidencia para una nueva tarea e infiere la hipótesis verdadera sin actualizaciones de parámetros en el momento de la inferencia. En puntos de referencia deterministas, probabilísticos y estructurados, incluyendo BAI y búsqueda generalizada, ICPE supera las líneas base adaptativas sin modelar explícitamente la estructura de la información.