Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

MoSEs: Uncertainty-Aware AI-Generated Text Detection via Mixture of Stylistics Experts with Conditional Thresholds

Created by
  • Haebom

作者

Junxi Wu, Jinpeng Wang, Zheng Liu, Bin Chen, Dongjian Hu, Hao Wu, Shu-Tao Xia

概要

本論文は、大規模言語モデルの誤用の可能性に関する懸念が高まるにつれて、信頼できるAI生成テキスト検出システムの構築の重要性を強調します。既存の方法はスタイルモデリングを見落とし、静的しきい値に依存して検出性能が大幅に制限される問題を指摘し、スタイル認識の不確実性を定量化するための条件付きしきい値推定を可能にするMixture of Stylistic Experts(MoSEs)フレームワークを提案しています。 MoSEはスタイル参照リポジトリ(SRR)、スタイル認識ルータ(SAR)、条件付きしきい値推定器(CTE)の3つの主要コンポーネントで構成されています。 MoSEsは、判別スコアとともに、対応する信頼レベルを持つ予測ラベルを生成し、従来の方法と比較して平均11.34%の検出性能の向上を達成し、特に低資源環境では39.15%の向上を示します。ソースコードはFitHubに公開されています。

Takeaways、Limitations

Takeaways:
スタイル認識不確実性の定量化によりAI生成テキスト検出性能を向上させる新しいフレームワーク(MoSEs)を提示
従来方式と比較して平均11.34%、低資源環境で39.15%の性能向上を達成
動的しきい値設定によるより正確な検出
ソースコード開示による再現性と拡張性の確保
Limitations:
SRRのサイズと構成による性能低下の可能性
さまざまなスタイルと言語の一般化パフォーマンス検証が必要
新しいスタイルのAI生成テキストに対する適応性評価が必要
CTEの複雑さによる計算コストの増加の可能性
👍