LLM Web Dynamics: Tracing Model Collapse in a Network of LLMs
Created by
Haebom
作者
Tianyu Wang, Akira Horiguchi, Lingyou Pang, Carey E. Priebe
概要
本論文は、公開インターネットの合成データ使用量の増加が大規模言語モデル(LLM)トレーニングのデータ使用効率を高めたが、モデル崩壊の潜在的な脅威は十分に研究されていないことを指摘しています。従来の研究は、主に単一のモデル設定でモデルの崩壊を調査するか、統計的代用物にのみ依存していました。この研究では、ネットワークレベルでモデルの崩壊を調査するための効率的なフレームワークであるLLM Web Dynamics(LWD)を紹介します。検索拡張生成(RAG)データベースを使用してインターネットをシミュレートすることで、モデル出力の収束パターンを分析し、相互作用するガウス混合モデルとの推論を通じて、これらの収束の理論的保証を提供します。