Cet article aborde le problème de la classification de 18 dialectes arabes parlés dans 22 pays. À partir de tweets arabes issus de la base de données QADI, nous construisons et testons des modèles linguistiques à grande échelle (LLM) à l'aide de RNN, de modèles Transformer et de l'ingénierie des prompts. Le modèle MARBERTv2 obtient les meilleures performances avec une précision de 65 % et un score F1 de 64 %. Grâce aux derniers modèles de traitement automatique du langage (TALN) et à des techniques de prétraitement de pointe, nous identifions les principaux problèmes linguistiques liés à l'identification des dialectes arabes.