본 논문은 복잡한 문제에 뛰어난 성능을 보이는 추론 모델이 간단한 문제에 과도하게 사고하는 경향을 보인다는 문제점을 해결하기 위해, 사용자 친화적인 적응형 제어 가능한 추론 프레임워크인 SelfBudgeter를 제안한다. SelfBudgeter는 추론 전에 예산 추정 메커니즘을 통합하며, 이중 훈련 방식을 사용한다. 먼저, 모델은 표준화된 형식으로 토큰 예산을 예측하는 방법을 학습하고, 강화 학습 단계를 통해 문제 난이도에 따라 자율적으로 예산을 계획하고 이를 엄격히 준수하도록 훈련된다. SelfBudgeter는 초기 단계에서 예산 추정치를 출력하므로 사용자는 대기 시간을 예측할 수 있으며, 수동으로 미리 채워진 예산 필드를 통해 추론 길이를 제어할 수 있다. 실험 결과, SelfBudgeter는 문제 복잡성에 따라 예산을 동적으로 할당하여 GSM8K, MATH500, AIME2025 데이터셋에서 1.5B 모델의 평균 응답 길이 압축률 61%, 7B 모델의 48%를 달성하면서 정확도는 거의 유지했다.