본 논문은 인공지능(AI) 시스템의 성능이 고품질 훈련 데이터에 의존한다는 점을 고려하여, 아랍어를 사용하는 아이들의 음성 데이터 부족 문제를 해결하기 위해 레반트 아랍어 어린이 음성 데이터셋인 "Arabic Little STT"를 구축하고, 이를 기반으로 최첨단 자동 음성 인식(ASR) 모델인 Whisper의 성능을 평가합니다. 총 288명의 어린이(6~13세)의 355개 발화로 구성된 데이터셋을 사용하여 Whisper의 8가지 변형 모델을 평가한 결과, 성인 데이터셋 대비 어린이 음성 인식 성능이 현저히 낮음을 확인했습니다.