Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Entropy-Aware Branching for Improved Mathematical Reasoning

Created by
  • Haebom

저자

Xianzhi Li, Ethan Callanan, Xiaodan Zhu, Mathieu Sibue, Antony Papadimitriou, Mahmoud Mahfouz, Zhiqiang Ma, Xiaomo Liu

개요

본 논문은 대규모 언어 모델(LLM)이 토큰 생성 과정에서 불확실성으로 인해 수학적 추론에서 오류를 범하는 문제를 다룬다. 모델 출력 분포의 엔트로피가 높은 토큰에서 오류 발생 가능성이 높다는 것을 관찰하고, 이를 해결하기 위해 고확률 토큰에서 여러 가지 추론 경로를 병렬적으로 탐색하는 새로운 접근 방식을 제안한다. 즉, 가장 확률이 높은 단일 토큰을 선택하는 대신, 중요한 의사결정 지점에서 고확률 토큰을 기반으로 생성 과정을 동적으로 분기시켜 다양한 추론 경로를 탐색하고, 더 큰 모델의 외부 피드백을 활용하여 가장 일관되고 정확한 추론 경로를 선택한다. 수학적 단어 문제와 계산 문제에 대한 실험 결과, 이 분기 전략은 기존의 argmax 디코딩에 비해 소규모 LLM의 추론 능력을 최대 4.6% 향상시키는 것으로 나타났다.

시사점, 한계점

시사점:
소규모 LLM의 수학적 추론 능력 향상 가능성 제시.
엔트로피 기반의 동적 분기 전략을 통한 다양한 추론 경로 탐색 가능성 제시.
외부 모델 피드백을 활용한 추론 경로 선택의 효용성 확인.
한계점:
제안된 방법의 성능 향상이 4.6%로 상대적으로 제한적일 수 있음.
외부 모델의 크기 및 성능에 대한 의존성이 존재할 수 있음.
다양한 유형의 문제 및 LLM에 대한 일반화 가능성에 대한 추가 연구 필요.
계산 비용 증가 가능성.
👍