Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Search Wisely: Mitigating Sub-optimal Agentic Searches By Reducing Uncertainty

Created by
  • Haebom

作者

Peilin Wu, Mian Zhang, Xinlu Zhang, Xinya Du, Zhiyu Zoey Chen

Agent Retrieval-Augmented Generation (RAG) システムの検索行動分析と効率向上のための $\beta$-GRPO 提案

概要

Agentic RAGシステムは、動的、多段階推論、および情報検索を介してLLMを向上させますが、過度の検索(冗長情報検索)や不足している検索(必要な情報検索失敗)などの非効率的な検索動作を示す可能性があります。この研究では、これらの動作を定義し定量化し、複数のQAデータセットとエージェントRAGシステムでその発生率を明らかにしました。さらに、これらの非効率性とモデルの知識境界に対する不確実性との間の重要な関連性を確認し、応答精度が検索決定に対するモデルの不確実性と相関関係を有することを明らかにした。これを解決するために、信頼性の高い検索決定を補償する信頼度しきい値を組み込んだ強化学習ベースのトレーニング方法である$ \ beta $ -GRPOを提案しました。 7つのQAベンチマークで実験した結果、$\beta$-GRPOは3Bモデルのagent RAG能力を向上させ、他の強力なベースラインを上回り、平均精度一致スコアが4%高かった。

Takeaways、Limitations

Agentic RAGシステムの検索非効率性(過渡検索および不足検索)を定量的に分析しました。
検索の非効率性とモデルの知識境界に対する不確実性との間の関連性を明らかにした。
強化学習ベースの$\Beta$-GRPOを提案し、検索効率とパフォーマンスを向上させました。
3Bモデルは7つのQAベンチマークで優れた性能を達成しました。
具体的なLimitationsは論文では提示されていません。
👍