Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Real-Time Progress Prediction in Reasoning Language Models

Created by
  • Haebom

저자

Hans Peter Lynsg{\o}e Raaschou-jensen, Constanza Fierro, Anders S{\o}gaard

개요

최근 긴 사고 과정을 사용하는 추론 언어 모델의 발전은 복잡한 에이전트 작업에서 놀라운 능력을 보여주었습니다. 그러나 모델이 장기간에 걸쳐 작동함에 따라 사용자는 내부 진행 상황을 알 수 없어 기대 관리와 실시간 감독이 어려워집니다. 이 연구에서는 실시간 진행 예측이 가능한지 조사합니다. 진행 상황을 이산화하고 추론 상태를 분류하기 위해 선형 프로브를 훈련시킵니다. 그런 다음 추론 모델이 추론 중에 진행률 추정치(0$\rightarrow$100%)를 생성할 수 있도록 하는 2단계 미세 조정 접근 방식을 도입합니다. 최상의 미세 조정된 모델은 16,000개 미만의 토큰 시퀀스에 대해 평균 10%의 오차를 달성하여 모델 추론을 실시간으로 모니터링하고 해석할 수 있는 실용적인 메커니즘을 제공합니다.

시사점, 한계점

실시간 진행 예측을 위한 실용적인 메커니즘 제공
16,000 토큰 미만의 시퀀스에 대해 평균 10%의 오차 달성
긴 사고 과정을 사용하는 모델의 투명성 및 해석 가능성 향상
모델의 실시간 모니터링 및 감독 용이
오류가 10%로, 완벽한 예측은 아님
16,000개 이상의 토큰 시퀀스에 대한 성능은 제시되지 않음
연구가 특정 모델 및 작업에 한정될 수 있음
👍