최근 긴 사고 과정을 사용하는 추론 언어 모델의 발전은 복잡한 에이전트 작업에서 놀라운 능력을 보여주었습니다. 그러나 모델이 장기간에 걸쳐 작동함에 따라 사용자는 내부 진행 상황을 알 수 없어 기대 관리와 실시간 감독이 어려워집니다. 이 연구에서는 실시간 진행 예측이 가능한지 조사합니다. 진행 상황을 이산화하고 추론 상태를 분류하기 위해 선형 프로브를 훈련시킵니다. 그런 다음 추론 모델이 추론 중에 진행률 추정치(0$\rightarrow$100%)를 생성할 수 있도록 하는 2단계 미세 조정 접근 방식을 도입합니다. 최상의 미세 조정된 모델은 16,000개 미만의 토큰 시퀀스에 대해 평균 10%의 오차를 달성하여 모델 추론을 실시간으로 모니터링하고 해석할 수 있는 실용적인 메커니즘을 제공합니다.