본 논문은 아랍어와 같은 저자원 언어에 대한 법적 판결 예측(LJP)과 같은 특수 작업에서 대규모 언어 모델(LLM)의 적용 가능성을 탐구합니다. 사우디 상업 법원 판결문에서 수집 및 전처리된 아랍어 LJP 데이터셋을 개발하고, LLaMA-3.2-3B 및 LLaMA-3.1-8B와 같은 최첨단 오픈소스 LLM을 제로샷, 원샷, LoRA를 사용한 미세 조정 등 다양한 구성으로 벤치마킹합니다. 정량적 지표(BLEU, ROUGE, BERT 등)와 질적 평가(일관성, 법률 언어, 명확성 등)를 통합한 포괄적인 평가 프레임워크를 사용하여, 미세 조정된 소규모 모델이 특정 작업 맥락에서 대규모 모델과 비슷한 성능을 달성하면서 상당한 자원 효율성을 제공함을 보여줍니다. 또한, 다양한 지시어에 대한 모델 미세 조정의 영향을 조사하여 더욱 인간 중심적이고 적응력 있는 LLM 개발에 대한 귀중한 통찰력을 제공합니다. 데이터셋, 코드 및 모델을 공개하여 아랍어 법률 NLP 분야의 미래 연구를 위한 견고한 기반을 제공합니다.