本論文は、ディープフェイク音声検出研究の重要な分野である音声合成物のソース追跡のための体系的にキュレーションされたデータセットの欠如の問題を解決するために、STOPAという新しいデータセットを紹介します。 STOPAは、8つの音響モデル(AM)、6つのボコーダモデル(VM)、および13の異なるシンセサイザで生成された70万のサンプルを含み、さまざまなパラメータ設定を体系的に扱います。従来のデータセットとは異なり、STOPAはボコーダモデル、音響モデル、事前訓練された重みの選択など、さまざまな生成要素を網羅する体系的に制御されたフレームワークを提供し、帰属信頼性を向上させます。