Cet article aborde les défis du développement d'un système de détection du cyberharcèlement (CB) pour les utilisateurs en ligne, y compris les enfants. Plus précisément, nous proposons une méthode de génération de données synthétiques et d'étiquettes à l'aide d'un modèle de langage à grande échelle (LLM) afin de pallier le manque de données étiquetées reflétant le langage et les styles de communication des enfants. Les résultats expérimentaux montrent qu'un classificateur CB basé sur BERT, entraîné sur des données synthétiques générées via LLM, atteint des performances comparables (précision de 75,8 % contre 81,5 %) à un classificateur entraîné sur des données réelles. De plus, LLM est également efficace pour l'étiquetage de données réelles, le classificateur BERT atteignant des performances comparables (précision de 79,1 % contre 81,5 %). Cela suggère que LLM peut être une solution évolutive, éthique et rentable pour générer des données de détection du cyberharcèlement.