Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SelfBudgeter: Adaptive Token Allocation for Efficient LLM Reasoning

Created by
  • Haebom

저자

Zheng Li, Qingxiu Dong, Jingyuan Ma, Di Zhang, Zhifang Sui

개요

본 논문은 대규모 추론 모델이 단순 및 복잡한 질의 모두를 비효율적으로 과도하게 처리하여 자원 낭비와 사용자 지연 시간을 초래하는 문제를 해결하기 위해, 자가 적응 제어 추론 전략인 SelfBudgeter를 제안한다. SelfBudgeter는 이중 단계 학습 방식을 채택하여, 먼저 질의의 난이도에 따라 추론 비용을 사전 예측하고, 그 다음 예산 기반 강화 학습을 통해 정확도를 유지하면서 출력 길이를 줄인다. 사용자는 생성 시간을 예상하고 프로세스를 계속할지 중단할지에 대한 정보에 입각한 결정을 내릴 수 있으며, 토큰 예산 사전 채우기를 통해 추론 길이를 직접 조작할 수 있다. 실험 결과, SelfBudgeter는 문제 복잡도에 따라 합리적으로 예산을 할당하여 MATH 벤치마크에서 최대 74.47%의 응답 길이 압축을 달성하면서 정확도는 거의 유지하는 것으로 나타났다.

시사점, 한계점

시사점:
대규모 추론 모델의 효율성을 크게 향상시킬 수 있는 새로운 방법 제시.
사용자에게 추론 시간 예측 및 제어 기능 제공.
문제 복잡도에 따라 예산을 동적으로 할당하여 자원을 효율적으로 사용.
MATH 벤치마크에서 응답 길이를 상당히 줄이면서 정확도를 유지하는 성능 입증.
한계점:
SelfBudgeter의 성능은 MATH 벤치마크에 국한되어 다른 벤치마크에서의 일반화 성능은 추가 연구 필요.
예산 사전 채우기를 통한 추론 길이 조작의 정확성 및 효율성에 대한 추가 분석 필요.
추론 비용 사전 예측의 정확도에 따라 성능이 영향을 받을 수 있음.
실제 응용 환경에서의 성능 및 안정성에 대한 추가적인 검증 필요.
👍