본 논문은 블랙박스 조합 최적화 문제를 위한 생성적이고 엔드-투-엔드 방식의 솔버를 제안합니다. 샘플 효율성과 해의 질 모두를 NP 문제에서 강조합니다. 어닐링 기반 알고리즘에서 영감을 얻어, 블랙박스 목적 함수를 에너지 함수로 취급하고, 관련 볼츠만 분포를 모델링하는 신경망을 학습합니다. 온도를 조건으로 함으로써, 네트워크는 고온에서는 거의 균일한 분포에서 저온에서는 전역 최적점 주변에 급격하게 뾰족한 분포까지 연속적인 분포를 포착하여 에너지 지형의 구조를 학습하고 전역 최적화를 용이하게 합니다. 쿼리가 비쌀 경우, 온도 의존적 분포는 자연스럽게 데이터 증강을 가능하게 하고 샘플 효율성을 향상시킵니다. 쿼리가 저렴하지만 문제가 어려운 경우, 모델은 암시적인 변수 상호 작용을 학습하여 블랙박스를 효과적으로 "여는" 역할을 합니다. 제한된 및 무제한 쿼리 예산 모두에서 어려운 조합 작업에 대한 접근 방식을 검증하여 최첨단 블랙박스 최적화 프로그램과 경쟁력 있는 성능을 보여줍니다.