본 논문은 대규모 추론 모델이 단순 및 복잡한 질의 모두를 비효율적으로 과도하게 처리하여 자원 낭비와 사용자 지연 시간을 초래하는 문제를 해결하기 위해, 자가 적응 제어 추론 전략인 SelfBudgeter를 제안한다. SelfBudgeter는 이중 단계 학습 방식을 채택하여, 먼저 질의의 난이도에 따라 추론 비용을 사전 예측하고, 그 다음 예산 기반 강화 학습을 통해 정확도를 유지하면서 출력 길이를 줄인다. 사용자는 생성 시간을 예상하고 프로세스를 계속할지 중단할지에 대한 정보에 입각한 결정을 내릴 수 있으며, 토큰 예산 사전 채우기를 통해 추론 길이를 직접 조작할 수 있다. 실험 결과, SelfBudgeter는 문제 복잡도에 따라 합리적으로 예산을 할당하여 MATH 벤치마크에서 최대 74.47%의 응답 길이 압축을 달성하면서 정확도는 거의 유지하는 것으로 나타났다.