[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Leveraging the Potential of Prompt Engineering for Hate Speech Detection in Low-Resource Languages

Created by
  • Haebom

作者

Ruhina Tabasshum Prome (Bangladesh Institute of Governance,Management), Tarikul Islam Tamiti (George Mason University), Anomadarshi Barua (George Mason University)

概要

この論文では、低資源言語であるベンガル語での憎悪表現を検出するための大規模言語モデル(LLM)のプロンプトエンジニアリングを研究します。従来の高資源言語に焦点を当てた研究とは異なり、低資源言語のデータ不足の問題を解決するために、ゼロショットプロンプト、拒否抑制、分類器のお世辞、マルチショットプロンプティング、役割プロンプト、革新的な比喩プロンプティングなど、6つのプロンプティング戦略を検討します。具体的には、メタファープロンプトは、LLMの組み込み安全メカニズムを迂回する新しい方法として提示されます。 Llama2-7Bモデルの6つのプロンプト戦略のパフォーマンスを、GloVe、Word2Vec、FastTextの3つの事前訓練された単語埋め込みとMLP、CNN、BiGRUの3つの深層学習モデルと比較分析し、F1スコアと環境影響指数(IF)を使用して評価します。また、ベンガル語の他に、低資源言語であるヒンディー語と高資源言語である英語、ドイツ語でも比喩プロンプトの効果を検証します。

Takeaways、Limitations

Takeaways:
低資源言語における憎悪表現検出問題に対する効果的な解決法としてプロンプトエンジニアリング手法を提示
従来の方法とは異なり、LLMの安全メカニズムをバイパスする革新的な比喩プロンプト技術を提案。
様々なプロンプト戦略と深層学習モデル、単語埋め込み技術を比較分析して最適な組み合わせを提示します。
環境影響指数(IF)を考慮した持続可能なモデル開発方向の提示。
低資源言語(ベンガル語、ヒンディー語)だけでなく、高資源言語(英語、ドイツ語)でも比喩プロンプトの効果を検証。
Limitations:
特定のLLM(Llama2-7B)と限られた言語データセットの結果であるため、一般化の可能性に関するさらなる研究が必要です。
比喩プロンプトの効果の理論的説明と一般化の可能性に関するさらなる研究が必要
使用されるデータセットの品質とサイズによっては、結果が影響を受ける可能性があります。
環境影響指数(IF)測定の正確性と信頼性をさらに検討する必要があります。
👍