Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

DIVER: A Multi-Stage Approach for Reasoning-intensive Information Retrieval

Created by
  • Haebom

作者

Meixiu Long, Duolin Sun, Dan Yang, Junjie Wang, Yue Shen, Jian Wang, Peng Wei, Jinjie Gu, Jiahai Wang

概要

本論文は、知識集約的な作業におけるクエリー文書関連性を直接的な語彙またはセマンティックマッチングによって識別できる環境で強力な性能を達成した検索増強生成モデルの限界を扱う。従来の検索システムは、抽象的推論、推論的思考、または多段階推論を含む多くの実際のクエリを捕捉することが困難である。これらの問題を解決するために、論文は推論集約的な情報検索のために設計された検索パイプラインであるDIVERを提示します。 DIVERは、入力品質を向上させるための文書処理、反復的な文書対話によるLLMベースのクエリ拡張、ハードネガティブを使用した合成多領域データから微調整された推論強化検索、およびLLMによって割り当てられた有用性スコアと検索スコアを組み合わせた4つのコンポーネントで構成されています。 BRIGHTベンチマークでは、DIVERは元のクエリに対して最先端のnDCG @ 10スコア41.6と28.9を達成し、競争的な推論認識モデルを一貫して上回ります。これらの結果は、複雑な実際の作業における推論認識検索戦略の効果を示しています。コードと検索モデルはまもなく公開される予定です。

Takeaways、Limitations

Takeaways:推論集約的な情報検索のための効果的な新しい検索パイプラインDIVERの提示。 BRIGHTベンチマークでSOTA性能を達成。 LLMベースの問合せ拡張と推論強化検索器の効果を実証複雑な実務における推論認識検索戦略の重要性を強調
Limitations:コードと検索モデルはまだ公開されていません。 BRIGHTベンチマーク以外のベンチマークでのパフォーマンス検証が必要です。さまざまな種類の推論作業の一般化性能評価が必要
👍