Cet article propose EvoP, un framework d'élagage évolutif, pour résoudre le problème du déploiement de modèles de langage à grande échelle (LLM) dans des environnements aux ressources limitées. Pour remédier à la dégradation des performances et à la négligence des caractéristiques des données des méthodes d'élagage heuristiques existantes, EvoP introduit une stratégie d'échantillonnage de données d'étalonnage par cluster (CCDS) pour générer divers jeux de données d'étalonnage, ainsi qu'une méthode de recherche de modèles d'élagage évolutif (EPPS) pour identifier les modèles d'élagage optimaux. Des expérimentations sur divers LLM et sous-tâches démontrent l'efficacité d'EvoP, démontrant sa solution pratique et évolutive pour le déploiement de LLM dans des applications concrètes.