본 연구는 유네스코의 20세기 중반 라디오 녹음 자료를 활용하여, 현대의 상용 언어 식별(LID) 및 화자 인식(SR) 방법의 견고성을, 특히 다국어 화자 및 시대를 초월한 녹음의 영향과 관련하여 조사했습니다. Whisper와 같은 LID 시스템은 제2언어 및 억양이 있는 발화를 처리하는 데 점점 능숙해지고 있음을 보여줍니다. 그러나 화자 임베딩은 채널, 나이, 언어와 관련된 편향에 취약한, 음성 처리 파이프라인의 취약한 구성 요소로 남아 있습니다. 아카이브가 화자 색인화에 SR 방법을 사용하려면 극복해야 할 문제입니다.