Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

AutoSchemaKG: Autonomous Knowledge Graph Construction through Dynamic Schema Induction from Web-Scale Corpora

Created by
  • Haebom

作者

Jiaxin Bai, Wei Fan, Qi Hu, Qing Zong, Chunyang Li, Hong Ting Tsang, Hongyu Luo, Yauwai Yim, Haoyu Huang, Xiao Zhou, Feng Qin, Tianshi Zheng, Xi Peng, Xin Yao, Huiwen Yang, Leijie Wu Yi,歌

概要

AutoSchemaKGは、事前定義されたスキーマなしで完全に自律的な知識グラフを作成するためのフレームワークです。大規模な言語モデルを活用して、テキストから知識トリプルを抽出し、包括的なスキーマを同時に導き出し、オブジェクトとイベントの両方をモデル化し、概念化を通じてインスタンスを意味論的カテゴリに編成します。 5000万以上の文書を処理し、9億を超えるノードと59億のエッジを持つ知識グラフATLAS(Automated Triple Linking And Schema induction)を構築しました。このアプローチは、多段階のクエリ応答の課題で最先端の基準を上回り、LLMの現実性を向上させます。具体的には、スキーマ誘導は、人間が作成したスキーマと手動介入なしに92%のセマンティックアライメントを達成し、動的に誘導されたスキーマを持つ10億単位の知識グラフが大規模言語モデルのパラメータ知識を効果的に補完できることを示しています。

Takeaways、Limitations

Takeaways:
事前定義されたスキーマなしで完全に自律的に知識グラフを構築するための新しいフレームワークの提示。
大規模言語モデルを活用して知識トリプル抽出とスキーマ誘導を同時に実行
10億単位規模の知識グラフATLAS構築による多段階の質疑応答性能の向上とLLMの現実性の向上
自動誘導スキーマが人間が作成したスキーマと高いセマンティックアライメントを達成する(92%)。
大規模言語モデルのパラメータ知識を効果的に補完する動的に導出されたスキーマを持つ知識グラフの可能性を提示する。
Limitations:
論文で明示的に言及されているLimitationsはありません。さらなる研究は、スキーマ誘導の精度を向上させ、さまざまなデータ型に対する適用可能性検証を必要とするかもしれません。さらに、生成された知識グラフの完全性と信頼性の追加の評価が必要になる場合があります。
👍