Dans cet article, nous présentons HumanoidGen, un nouveau système de génération de jeux de données et de benchmark pour la manipulation bimanuelle utilisant les deux bras et les mains agiles de robots humanoïdes. Alors que les jeux de données robotiques et les benchmarks de simulation existants se concentrent principalement sur les plateformes de bras robotiques, la manipulation bimanuelle de robots humanoïdes est beaucoup plus complexe, rendant la collecte de données autonome difficile. HumanoidGen exploite le mouvement agile au niveau atomique et l'inférence de modèles de langage à grande échelle (LLM) pour générer des contraintes relationnelles et fournir des annotations spatiales pour les actifs et les mains. De plus, nous améliorons l'inférence de LLM pour les tâches de longue durée et les annotations insuffisantes grâce à une variante de la recherche arborescente de Monte-Carlo. Les résultats expérimentaux montrent que le jeu de données généré peut améliorer les performances des politiques de diffusion 2D et 3D.