[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Preprint: Did I Just Browse A Website Written by LLMs?

Created by
  • Haebom

作者

Sichang "Steven" He, Ramesh Govindan, Harsha V. Madhyastha

概要

本論文は、大規模言語モデル(LLM)によって自動生成されたWebコンテンツ、つまり「LLM-dominant」コンテンツの検出に信頼できる拡張可能なパイプラインを提案します。散文形式のページのLLMテキスト検出器の出力に基づいて、各サイトを分類するパイプラインを提示します。検出され、これらのサイトが検索結果で高いランクを占めており、その数が増加していることを発見し、エンドユーザーとWebエコシステム全体に与える影響について懸念を提起しています。

Takeaways、Limitations

Takeaways:
LLM-dominantコンテンツを検出するための効果的でスケーラブルなパイプラインを提供します。
Web上のLLM-dominantコンテンツの広がりと検索順位の上昇を確認し、それに伴う悪影響を警告します。
LLM-dominantコンテンツ検出技術の重要性を強調します。
Limitations:
現在提示されているパイプラインのパフォーマンス評価は、限られたデータセット(120サイト)に基づいています。より広範で多様なデータセットを使用した追加の検証が必要です。
LLM-dominantコンテンツの定義および分類基準に関する明確なガイドラインが不足している可能性があります。
LLMの継続的な発展と新たな生成方式の登場により、検出器の性能低下の可能性がある。
👍