Este artículo presenta PennyLang, un conjunto de datos de alta calidad dedicado a PennyLane, para abordar la falta de conjuntos de datos de alta calidad que limita el uso de modelos de lenguaje a gran escala (LLM) en el desarrollo de software cuántico. PennyLang consta de 3347 muestras de código cuántico de PennyLane y descripciones contextuales recopiladas de libros de texto, documentos oficiales y repositorios de código abierto. Este artículo presenta tres contribuciones: la generación y publicación de PennyLang, un marco automatizado para la construcción de conjuntos de datos de código cuántico, y la evaluación de referencia utilizando múltiples modelos de código abierto dentro del pipeline de Recuperación-Generación Aumentada (RAG). Los resultados experimentales demuestran que la combinación de RAG y PennyLang mejora significativamente el rendimiento de los modelos Qwen 7B y LLaMa 4. Esto contrasta con investigaciones previas centradas en Qiskit, que contribuyen al avance del desarrollo cuántico asistido por IA al proporcionar herramientas basadas en LLM y métodos reproducibles para PennyLane.