본 논문은 블랙박스 딥 제너러티브 모델로부터 주어진 입력(예: 텍스트 프롬프트)에 대한 유효하고 작은 예측 집합을 생성하는 문제를 다룬다. 예측 집합의 유효성은 사용자가 정의한 이진 허용 가능성 함수에 따라 결정되며, 예를 들어 코드 생성 애플리케이션에서 집합 내 적어도 하나의 프로그램이 모든 테스트 케이스를 통과하는 것을 요구할 수 있다. 이 문제를 해결하기 위해, 논문에서는 Generative Prediction Sets (GPS) 라는 간단하고 효과적인 순응 추론 알고리즘을 개발한다. GPS는 교정 예제 집합과 딥 제너러티브 모델에 대한 블랙박스 접근을 통해 증명 가능한 보장을 가진 예측 집합을 생성할 수 있다. GPS의 핵심 아이디어는 허용 가능한 출력을 얻는 데 필요한 최소 샘플 수에 대한 분포 내의 고유 구조를 활용하여 최소 샘플 수에 대한 간단한 순응 회귀 접근 방식을 개발하는 것이다. 다양한 대규모 언어 모델을 사용하여 코드 및 수학 문제에 대한 여러 데이터 세트에서의 실험은 최첨단 방법에 비해 GPS의 효과를 보여준다.