Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

DynamicNER: A Dynamic, Multilingual, and Fine-Grained Dataset for LLM-based Named Entity Recognition

Created by
  • Haebom

作者

Hanjun Luo, Yingbin Jin, Xinfeng Li, Xuecheng Liu, Ruizhe Chen, Tong Shang, Kun Wang, Qingsong Wen, Zuozhu Liu

概要

本論文は、大規模言語モデル(LLM)ベースの個体名認識(NER)方法論の発展に伴い、既存のNERデータセットの限界を指摘し、これを克服するための新しいデータセットDynamicNERとNER方法論CascadeNERを提案します。従来のデータセットは、従来の機械学習方法論に焦点を当てて設計されており、LLMベースの方法論の特性を十分に考慮していません。 DynamicNERは、動的オブジェクト分類、多言語サポート(8言語)、さまざまなセグメンテーションレベル(155オブジェクトタイプ)、さまざまなドメインの束を含む、LLMベースのNERの一般化能力とコンテキスト理解能力を適切に評価できるように設計されています。 CascadeNERは、軽量化されたLLMを使用した2段階戦略ベースの新しいNER方法論で、細分化された作業で高精度を達成しながら、計算リソースの消費を削減します。実験の結果、DynamicNERはLLMベースのNER方法論のための強力で効果的なベンチマークとして機能し、既存の方法とLLMベースの方法の比較分析の結果も提供します。コードとデータセットは公開されています。

Takeaways、Limitations

Takeaways:
LLMベースのNER方法論の性能評価のための新しい基準データセットDynamicNERを提供
LLMの利点を活用した効率的で正確なNER方法論 CascadeNERの提案
多言語、さまざまなセグメンテーションレベル、さまざまなドメインをサポートするデータセットでLLMベースのNERの発展に貢献
従来のNER方法論とLLMベースのNER方法論の比較分析によりLLMベースのNERの卓越性を実証
Limitations:
DynamicNERデータセットの規模と多様性の追加検証が必要
CascadeNERの一般化性能と他のLLMとの比較分析が必要
特定のドメインまたは言語に対する偏りの存在の可能性
動的分類システムの複雑さによる困難の発生の可能性
👍