본 논문은 아랍어 자연어 처리(NLP) 분야에서 대규모 언어 모델(LLMs)의 활용에 대한 개요를 제공합니다. 아랍어는 광범위하게 사용되지만, 관련 자원과 데이터셋이 부족하다는 점을 고려하여, 다국어 말뭉치로 사전 훈련된 LLMs가 다양한 아랍어 NLP 과제에서 상당한 성공을 거두었다는 점을 강조합니다. 다양한 아랍어 NLP 애플리케이션에서 사용되는 초기 사전 훈련된 아랍어 LLMs와 다양한 아랍어 콘텐츠 및 방언 처리 능력을 조명하고, 미세 조정 및 프롬프트 엔지니어링과 같은 기법을 통해 모델 성능을 향상시키는 방법을 개괄적으로 설명합니다. 또한, 일반적인 아랍어 벤치마크와 데이터셋을 요약하고 LLMs 채택의 지속적인 상승 추세에 대한 관찰 결과를 제시합니다.