본 논문은 다국어 코드 전환(Code-switching, CS) 음성 인식 시스템의 성능 향상을 위해 대규모 다국어, 다민족 코드 전환 데이터셋인 SwitchLingua를 제시합니다. 기존의 코드 전환 데이터셋이 제한적인 규모와 다양성을 가지는 것에 비해, SwitchLingua는 12개 언어, 174명의 화자(18개 국가/지역, 63개 인종/민족 배경), 42만 개의 텍스트 샘플, 80시간 이상의 오디오 데이터를 포함합니다. 데이터 생성에는 효율적이고 확장 가능한 다에이전트 협업 프레임워크인 LinguaMaster가 사용되었습니다. 또한, 기존의 ASR 평가 지표의 한계를 극복하기 위해 의미 정보를 통합한 새로운 평가 지표인 Semantic-Aware Error Rate (SAER)를 제안합니다.