Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Resisting Contextual Interference in RAG via Parametric-Knowledge Reinforcement

Created by
  • Haebom

作者

Chenyu Lin, Yilin Wen, Du Su, Hexiang Tan, Fei Sun, Muhan Chen, Chenfu Bao, Zhonghou Lyu

Knowledgeable-R1:コンテキスト干渉抵抗のための強化学習ベースのRAGフレームワーク

概要

Knowledgeable-R1は、知識集約型タスクのパフォーマンスを向上させるために提案された強化学習ベースのRetrieval-Augmented Generation(RAG)フレームワークです。間違っているか関連しないテキストが原因で、モデルが不正確な情報に依存し、エラーが発生する問題を解決したいと思います。 Knowledgeable-R1は、パラメトリック知識(PK)を活用してコンテキスト干渉に抵抗し、外部コンテキストが信頼できるときにそれを活用するように大規模な言語モデルを明示的に学習します。このフレームワークは、検索の有無に応じて応答ペアを生成する共同サンプリング方式を使用し、誤解を招くコンテキストを無視または採用する必要がある場合を定量化するために、ローカルおよびグローバルの利点を学習します。また、パラメトリック指向の探索行動を増幅する非対称の利点変換を使用します。

Takeaways、Limitations

Takeaways:
知識紛争の状況における堅牢性と推論精度を向上させる。
Counterfactualシナリオでは、従来のState-of-the-Art(SOTA)と比較して23%のパフォーマンスが向上しました。
検索されたコンテキストが正しい場合、パフォーマンスが低下しません。
GitHubでコードを公開。
Limitations:
論文に記載されているLimitationsは提示されていません。
👍