本論文では、検索拡張生成(RAG)におけるユーティリティベース検索の効率を高めるために、大規模言語モデル(LLM)のユーティリティ判断能力を小型モデルに蒸留する方法を提案します。特に、複雑な質問に対する回答を生成するためにユーティリティベースの選択アプローチを適用し、固定しきい値ではなく動的段落の選択を可能にします。教師LLM(Qwen3-32B)から偽の回答の生成とユーティリティ判断を学習した学生モデル(RankQwen1.7B、UtilityQwen1.7B)を訓練し、計算コストを削減しながら回答品質を向上させました。 MS MARCOデータセットの関連性ランキングとユーティリティベースの選択コメントを公開し、その分野の研究を支援する予定です。