Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

The State of Large Language Models for African Languages: Progress and Challenges

Created by
  • Haebom

저자

Kedir Yassin Hussen, Walelign Tewabe Sewunetie, Abinew Ali Ayele, Sukairaj Hafiz Imam, Shamsuddeen Hassan Muhammad, Seid Muhie Yimam

개요

본 논문은 아프리카의 2,000여 개 저자원 언어에 대한 대규모 언어 모델(LLM)의 적용 가능성을 분석한 연구입니다. 6개의 LLM, 8개의 소규모 언어 모델(SLM), 6개의 특수화된 SLM(SSLM)을 비교 분석하여 아프리카 언어 지원 현황, 학습 데이터셋, 기술적 한계, 문자 문제, 언어 모델링 로드맵 등을 평가했습니다. 분석 결과, 42개의 아프리카 언어가 지원되고 23개의 공개 데이터셋이 존재하지만, 아직도 98% 이상의 아프리카 언어는 지원되지 않는 큰 격차가 존재함을 밝혔습니다. 또한, 라틴, 아랍, 게에즈 문자만 지원되고 20개 이상의 활성 문자는 무시되고 있음을 지적했습니다. 주요 문제점으로는 데이터 부족, 토큰화 편향, 높은 계산 비용, 평가 문제 등을 제시했습니다.

시사점, 한계점

시사점:
아프리카 저자원 언어에 대한 LLM 적용의 심각한 부족 현황을 제시.
아프리카 언어 지원을 위한 데이터셋, 언어 표준화, 효과적인 적응 방법 개발의 필요성 강조.
아프리카 언어 지원을 위한 현황 파악 및 향후 연구 방향 제시.
한계점:
분석 대상 모델의 수가 제한적일 수 있음.
아프리카 언어의 다양성을 완벽히 반영하지 못했을 가능성.
제시된 문제 해결을 위한 구체적인 해결 방안 제시 부족.
👍