Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

MoSEs: Uncertainty-Aware AI-Generated Text Detection via Mixture of Stylistics Experts with Conditional Thresholds

Created by
  • Haebom

作者

Junxi Wu, Jinpeng Wang, Zheng Liu, Bin Chen, Dongjian Hu, Hao Wu, Shu-Tao Xia

概要

本稿では、大規模言語モデルの誤用に関する懸念が高まるにつれて、信頼できるAI生成テキスト検出システムの構築の重要性を強調します。既存の方法のスタイルモデリングの欠如と静的しきい値の使用によるパフォーマンスの低下の問題を解決するために、スタイル認識の不確実性を定量化するための条件付きしきい値の推定を可能にするMixture of Stylistic Experts(MoSEs)フレームワークを提案します。 MoSEは、スタイル参照リポジトリ(SRR)、スタイル認識ルータ(SAR)、条件付きしきい値推定器(CTE)の3つの重要なコンポーネントで構成されています。入力テキストに対して、SRRは適切な参照データをアクティブにしてCTEに提供し、CTEは言語統計的特性と意味的特徴を一緒にモデル化して最適しきい値を動的に決定します。 MoSEsは、判別スコアとともに、対応する信頼レベルを持つ予測ラベルを生成し、基準モデルと比較して平均11.34%の検出性能の向上を達成し、特に低資源環境では39.15%のより大きな向上を示します。ソースコードはhttps://github.com/creator-xi/MoSEsで利用できます。

Takeaways、Limitations

Takeaways:
スタイル認識の不確実性の定量化により、AI生成テキスト検出のパフォーマンスが向上しました。
既存の方法の限界を克服し、低資源環境でも性能改善を見せた。
提案されたMoSEフレームワークは、実際のアプリケーションに適用可能性を高めました。
公開されたソースコードにより、再現性とさらなる研究が容易になりました。
Limitations:
特定のスタイルや言語に偏りがある可能性があります。
新しいスタイルのAI生成テキストに対する適応性に関するさらなる研究が必要である。
実際の環境でのパフォーマンス評価とさまざまなデータセットの検証が必要です。
計算コストとリソース消費の考慮が必要な場合があります。
👍