[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Label-semantics Aware Generative Approach for Domain-Agnostic Multilabel Classification

Created by
  • Haebom

作者

Subhendu Khatuya、Shashwat Naidu、Saptarshi Ghosh、Pawan Goyal、Niloy Ganguly

概要

この論文は、急増するテキストデータの手動分類の難しさを解決するために、ドメインに依存しない強力で効率的な生成モデルフレームワークLAGAMCを提案します。既存のラベルをアトミックシンボルとして扱う代わりに、あらかじめ定義されたラベルの説明を活用して、入力テキストに基づいてこれらの説明を生成するようにモデルを学習します。推論プロセスでは、微調整された文コンバータを使用して生成された説明を事前定義されたラベルと一致させます。クロスエントロピー損失と生成された文と事前定義されたターゲット記述の余弦類似度を組み合わせた二重目的損失関数を組み込むことで、意味的な整列と精度の両方を保証します。 LAGAMCは、パラメータの効率性とさまざまなデータセットの汎用性のため、実際のアプリケーションに適しています。実験の結果、評価されたすべてのデータセットで既存の最高性能を上回り、最も近い基準モデルと比較してMicro-F1で13.94%、Macro-F1で24.85%向上した性能を達成しました。

Takeaways、Limitations

Takeaways:
さまざまなデータセットで従来の最高性能(SOTA)を超える性能を見せます。
パラメータ効率が高く、実用的な用途に適しています。
ドメインに依存せず、さまざまな分野に適用可能。
ラベルの説明を活用して意味的に豊富な分類が可能。
Limitations:
ラベルの説明の質によってはパフォーマンスが影響を受ける可能性があります。 (Predefined label descriptionsの質に関する議論の欠如)
提案されたモデルの一般化性能に関する追加の実験が必要になるかもしれません。
特定の種類のテキストデータのパフォーマンスが低下する可能性があります(特定のテキストタイプの実験結果が不足している)。
👍