Este artículo propone un solucionador generativo integral para la optimización combinatoria de caja negra en problemas NP. Inspirados en algoritmos basados en recocido, tratamos el objetivo de caja negra como una función de energía y entrenamos una red neuronal que modela la distribución de Boltzmann asociada. Al condicionar la temperatura, la red neuronal captura un continuo de distribuciones, que van desde casi uniformes a altas temperaturas hasta picos pronunciados alrededor del óptimo global a bajas temperaturas. Esto permite a la red aprender la estructura del panorama energético y facilitar la optimización global. Cuando las consultas son costosas, la distribución dependiente de la temperatura permite naturalmente el aumento de datos y mejora la eficiencia de la muestra. Cuando las consultas son económicas pero el problema es complejo, el modelo "abre" eficazmente la caja negra al aprender interacciones implícitas de variables. Validamos nuestro enfoque en tareas combinatorias complejas con presupuestos de consultas limitados e ilimitados, demostrando un rendimiento competitivo frente a los optimizadores de caja negra de última generación.