この研究では、大規模言語モデル(LLM)によって生成されたテキストと人間が作成したテキストとの間の抵抗変化を調べます。 Biberの多次元分析(MDA)を、人間が作成したテキストとそれに対応するAIが生成したテキストに適用して、LLMが人間と最も大きく体系的に異なる変異次元を探します。テキスト資料には、現代英国英語を表すBE-21(Brown family corpus)と比較可能な新しく作成されたLLM生成コーパスであるAI-Brownを使用します。最先端LLMの学習データでは英語を除くすべての言語が過小表現されているため、AI-Koditexコーパスとチェコ語多次元モデルを使用してチェコ語についても同様の分析を繰り返します。さまざまな設定とプロンプトで16の最先端モデルを調査し、基本モデルと指示調整モデルの違いに焦点を当てました。これに基づいて、モデルを互いに比較し、解釈可能な次元でランク付けできるベンチマークを作成します。