본 논문은 아프리카의 2,000여 개 저자원 언어에 대한 대규모 언어 모델(LLM)의 적용 가능성을 분석한 연구입니다. 6개의 LLM, 8개의 소규모 언어 모델(SLM), 6개의 특수화된 SLM(SSLM)을 비교 분석하여 아프리카 언어 지원 현황, 학습 데이터셋, 기술적 한계, 문자 문제, 언어 모델링 로드맵 등을 평가했습니다. 분석 결과, 42개의 아프리카 언어가 지원되고 23개의 공개 데이터셋이 존재하지만, 아직도 98% 이상의 아프리카 언어는 지원되지 않는 큰 격차가 존재함을 밝혔습니다. 또한, 라틴, 아랍, 게에즈 문자만 지원되고 20개 이상의 활성 문자는 무시되고 있음을 지적했습니다. 주요 문제점으로는 데이터 부족, 토큰화 편향, 높은 계산 비용, 평가 문제 등을 제시했습니다.