[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

A Survey of Frontiers in LLM Reasoning: Inference Scaling, Learning to Reason, and Agentic Systems

Created by
  • Haebom

作者

Zixuan Ke, Fangkai Jiao, Yifei Ming, Xuan-Phi Nguyen, Austin Xu, Do Xuan Long, Minzhi Li, Chengwei Qin, Peifeng Wang, Silvio Savarese, Caiming Xiong, Shafiq Joty

概要

本論文は、大規模言語モデル(LLM)の推論能力を重点的に扱うアンケート論文である。 LLMの推論能力は高度なAIシステムを既存モデルと区別する重要な機能で、論文では既存の推論方法を2つの次元、つまり推論が行われる時点(推論時点または訓練による推論)を定義する「体制(Regimes)」と推論過程に関与するコンポーネント(スタンドアロンLLM、外部ツールを統合するエージェント) 「構造(Architectures)」に分類する。各次元内では、高品質のプロンプト生成技術に焦点を当てた「入力レベル」と、いくつかの候補サンプルを改善して推論品質を向上させる「出力レベル」の2つの観点を分析します。論文は、推論拡張から学習ベースの推論(DeepSeek-R1など)への移行、エージェントベースのワークフロー(OpenAI Deep Research、Manus Agentなど)への移行などの新しい傾向を強調しています。ワークフローの主な設計を扱う。

Takeaways、Limitations

Takeaways:
LLM推論方法を体系的に分類し、発展するLLM推論の分野の理解を深める。
推論拡張から学習ベースの推論への移行、エージェントベースのワークフローへの移行などの主要な傾向を提示します。
さまざまな学習アルゴリズムとエージェントベースのワークフロー設計を包括的に扱います。
Limitations:
本論文はアンケート論文であるため、新しい方法論や実験結果を提示しません。
扱う方法論の量が膨大であり、各方法論の詳細な分析が不足する可能性があります。
LLM推論分野の急速な発展により、論文発表時点以降、新しい方法論が登場する可能性がある。
👍