본 논문은 이탈리아어 구어 말뭉치 데이터셋에 대한 종합적인 분석을 제공합니다. 66개의 이탈리아어 구어 말뭉치 데이터셋을 분석하여 각 데이터셋의 특징, 방법론, 응용 분야를 조명하고, 음성 유형, 출처 및 맥락, 인구통계학적 및 언어적 특징에 따라 분류합니다. 자동 음성 인식, 감정 감지, 교육 등의 분야에서의 활용성에 초점을 맞추고, 데이터셋 부족, 대표성, 접근성과 관련된 문제점을 논의하며 데이터셋 생성 및 활용 개선을 위한 권장 사항을 제시합니다. GitHub 및 Zenodo를 통해 전체 데이터셋 목록에 공개적으로 접근할 수 있도록 하여 연구자와 개발자에게 귀중한 자료를 제공합니다. 이를 통해 이탈리아어 음성 기술과 언어 연구 발전에 기여하고자 합니다.