본 논문은 아랍어로 생성된 기계 학습 모델(LLM) 텍스트에 대한 포괄적인 조사를 제시합니다. 학계 및 소셜 미디어 도메인에서 다양한 모델 아키텍처(ALLaM, Jais, Llama, GPT-4)와 여러 생성 전략(제목만으로 생성, 콘텐츠 인식 생성, 텍스트 개선)을 사용하여 아랍어 기계 생성 텍스트를 분석했습니다. 스타일 분석을 통해 인간이 작성한 텍스트와 기계가 생성한 텍스트를 구별하는 독특한 언어적 패턴을 밝혀냈으며, 도메인별 특성이 다양한 맥락에서 크게 다름을 보였습니다. 이러한 통찰력을 바탕으로 BERT 기반 탐지 모델을 개발하여 공식적인 맥락에서 탁월한 성능(최대 99.9% F1-score)을 달성했습니다. 그러나 도메인 간 일반화의 어려움 또한 확인했습니다. 본 연구는 다양한 프롬프트 생성 방법, 다양한 모델 아키텍처, 다양한 텍스트 도메인에 대한 심층적인 스타일 분석을 독특하게 결합한, 아랍어 기계 생성 텍스트에 대한 가장 포괄적인 조사입니다.