본 논문은 딥페이크 음성 감지 연구의 핵심 분야인 음성 합성물의 출처 추적을 위한 체계적으로 큐레이션된 데이터셋의 부족 문제를 해결하기 위해, STOPA라는 새로운 데이터셋을 소개한다. STOPA는 8개의 음향 모델(AM), 6개의 보코더 모델(VM), 그리고 13개의 서로 다른 합성기에서 생성된 70만 개의 샘플을 포함하며, 다양한 매개변수 설정을 체계적으로 다룬다. 기존 데이터셋과 달리 STOPA는 보코더 모델, 음향 모델, 사전 훈련된 가중치 선택과 같은 다양한 생성적 요소를 포괄하는 체계적으로 통제된 프레임워크를 제공하여 귀속 신뢰도를 향상시킨다.