本文提出了一个用户友好、自适应且可控的推理框架 SelfBudgeter,以解决那些擅长处理复杂问题的推理模型往往会过度思考简单问题的问题。SelfBudgeter 在推理前集成了预算估算机制,并采用双重训练方法。首先,模型学习以标准化格式预测令牌预算。通过强化学习阶段,模型被训练成根据问题难度自主规划并严格遵守预算。SelfBudgeter 在流程早期输出预算估算,允许用户预测等待时间并通过预填充的预算字段手动控制推理长度。实验结果表明,SelfBudgeter 根据问题复杂度动态分配预算,在 GSM8K、MATH500 和 AIME2025 数据集上,15 亿模型的平均响应长度压缩率达到 61%,7 亿模型的平均响应长度压缩率达到 48%,同时保持了近乎完美的准确率。