Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Distilling a Small Utility-Based Passage Selector to Enhance Retrieval-Augmented Generation

Created by
  • Haebom

作者

Hengran Zhang, Keping Bi, Jiafeng Guo, Jiaming Zhang, Shuaiqiang Wang, Dawei Yin, Xueqi Cheng

Retrieval-augmented Generation(RAG)におけるユーティリティベース選択のための効率的なモデル蒸留

概要

本論文では、検索拡張生成(RAG)におけるユーティリティベース検索の効率を高めるために、大規模言語モデル(LLM)のユーティリティ判断能力を小型モデルに蒸留する方法を提案します。特に、複雑な質問に対する回答を生成するためにユーティリティベースの選択アプローチを適用し、固定しきい値ではなく動的段落の選択を可能にします。教師LLM(Qwen3-32B)から偽の回答の生成とユーティリティ判断を学習した学生モデル(RankQwen1.7B、UtilityQwen1.7B)を訓練し、計算コストを削減しながら回答品質を向上させました。 MS MARCOデータセットの関連性ランキングとユーティリティベースの選択コメントを公開し、その分野の研究を支援する予定です。

Takeaways、Limitations

Takeaways:
ユーティリティベースの選択は、複雑な質問に対する回答生成のパフォーマンスを向上させるのに効果的です。
LLMのユーティリティ判断能力をコンパクトなモデルに蒸留することで、計算コストを削減できます。
動的段落の選択により、特定の質問に合わせて柔軟に段落を選択できます。
MS MARCOデータセットの注釈の開示は、さらなる研究を促進します。
Limitations:
現在、Limitationsは論文に記載されていません。
👍