Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Opioid Named Entity Recognition (ONER-2025) から Reddit

Created by
  • Haebom

作者

Muhammad Ahmad, Rita Orji, Fida Ullah, Ildar Batyrshin, Grigori Sidorov

概要

この論文は、米国内の重大な公衆衛生問題であるオピオイドの過剰摂取危機の解決策として、Redditなどのソーシャルメディアプラットフォームでの非定型データ分析を提示します。独自のオピオイド使用経験を共有するRedditユーザーデータに基づいて、Opioid Named Entity Recognition(ONER-2025)を活用した自然言語処理(NLP)技術を使用して情報を抽出します。手動注釈付き331,285トークンの独自のデータセットを構築し、8つの主要なオピオイド項目カテゴリを含む注釈プロセスと難しさを詳しく説明します。また、オピオイド関連の議論に出てくる俗語、曖昧さ、断片的な文章、感情的に刺激的な言語などの言語的困難を分析し、機械学習、ディープラーニング、変圧器ベースの言語モデル、高度な状況的埋め込みを統合したリアルタイムモニタリングシステムを提案します。 5-fold cross-validationによって行われた11の実験では、bert-base-NERやroberta-baseなどのトランスベースのモデルが97%の精度とF1スコアを達成し、基準モデルより10.23%向上したパフォーマンスを示しました(RF = 0.88)。

Takeaways、Limitations

Takeaways:
ソーシャルメディアデータを活用したオピオイド過剰摂取危機モニタリングと予防システムの開発可能性を提示
ONER-2025データセットの構築とNLP技術の適用によるオピオイド関連情報の抽出と分析の効率性の証明
変圧器に基づくモデルの優れた性能によるリアルタイムモニタリングシステムの精度向上の可能性の確認
オピオイド関連言語的特徴分析による今後の研究方向の提示
Limitations:
Redditデータの偏りと一般化の可能性のレビューが必要です。
リアルタイムモニタリングシステムの実際の適用と効果に関するさらなる研究の必要性
データセットのサイズと多様性の制限によるモデルパフォーマンスの低下の可能性。
他のソーシャルメディアプラットフォームまたはデータソースの適用可能性に関する追加の研究が必要です。
👍