Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

AmpleHate: Amplifying the Attention for Versatile Implicit Hate Detection

Created by
  • Haebom

作者

Yejin Lee, Joonghyuk Hahn, Hyeseon Ahn, Yo-Sub Han

概要

この論文は、暗黙の憎悪表現を検出するための新しいアプローチであるAmpleHateを提案します。従来の対照学習ベースの方法とは異なり、AmpleHateは、人間の推論プロセスを模倣して明示的対象と暗黙的対象を識別し、それらと文脈との間の関係を分析して暗黙の憎悪表現を検出します。事前訓練されたNERモデルを使用して明示的なターゲットを見つけ、[CLS]トークンを介して暗黙のターゲット情報を取得し、アテンションベースの関係ベクトルを最終的な文の表現に直接注入して、ターゲットと文脈の関係の重要な信号を増幅します。実験の結果、AmpleHateは従来の対照学習ベースの方法よりも平均82.14%向上した性能を示し、より速い収束速度を達成しました。また、アテンションパターン解析により、人間の判断に合致した結果を示し、解釈の可能性と堅牢性を実証した。

Takeaways、Limitations

Takeaways:
人間の推論過程を模倣した新しい暗黙の憎悪表現の検出方式の提示
従来の対照学習ベースのアプローチと比較してパフォーマンスと収束率を向上させる(平均82.14%向上)
アテンションメカニズムによるモデルの判断の根拠を明確に提示し,解析の可能性と信頼性を向上
公開されたコードによる再現性の確保
Limitations:
具体的なLimitationsについての議論の欠如(論文に明示的に記載されていない)
特定のデータセットのパフォーマンス評価による一般化の可能性に関するさらなる研究が必要
さまざまな言語と文化的文脈の適用可能性レビューが必要
👍