Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

DiCoRe: Enhancing Zero-shot Event Detection via Divergent-Convergent LLM Reasoning

Created by
  • Haebom

作者

Tanmay Parekh, Kartik Mehta, Ninareh Mehrabi, Kai-Wei Chang, Nanyun Peng

概要

本稿では、専門分野文書の理解に重要なゼロショットイベント検出(ED)問題を解決するために、DiCoReという新しいフレームワークを提案します。 DiCoReは、イベントオントロジーの複雑さ、ドメイン固有のトリガ抽出、適切な構造化などの困難を克服するために、DreamerとGrounderという2つのモジュールを利用する発散収束推論方式を採用しています。ドリーマーは、オープンイベントの発見を通じて発散的推論を促進することによってイベントの範囲を拡大し、Grounderは有限状態機械ベースの制約復号化を使用して自由形式予測を特定の作業指針と整列させ、収束的推論を実行します。最後に、LLM-Judgeは最終出力の精度を検証します。 6つのデータセットと5つのドメイン、9つのLLMの広範な実験は、DiCoReが既存のゼロショット、遷移学習、および推論ベースの方法を上回り、最高基準モデルと比較して平均F1スコアを4〜7%向上させることを示しています。

Takeaways、Limitations

Takeaways:
ゼロショットイベント検出の分野で既存の方法を上回る新しいフレームワークDiCoReを提示します。
発散 - 収束推論スキームは、イベントの範囲と精度を向上させることができることを証明します。
様々なドメインとLLMの実験によるDiCoReの一般化性能の検証
Limitations:
LLM-Judgeの性能に依存する部分が存在し、LLM-Judgeの性能の低下がシステム全体の性能に影響を与える可能性があります。
さまざまなドメインの実験は行われましたが、特定のドメインのパフォーマンスが低下する可能性があります。追加のドメイン固有の分析が必要な場合があります。
提案されたフレームワークの計算コストと効率のさらなる分析が必要です。
👍