Bài báo này trình bày PennyLang, một bộ dữ liệu chất lượng cao dành riêng cho PennyLane, nhằm giải quyết tình trạng thiếu bộ dữ liệu chất lượng cao, vốn hạn chế việc sử dụng các mô hình ngôn ngữ quy mô lớn (LLM) trong phát triển phần mềm lượng tử. PennyLang bao gồm 3.347 mẫu mã lượng tử PennyLane và các mô tả theo ngữ cảnh được thu thập từ sách giáo khoa, tài liệu chính thức và kho lưu trữ mã nguồn mở. Bài báo này trình bày ba đóng góp: việc tạo ra và phát hành PennyLang, một khuôn khổ xây dựng bộ dữ liệu mã lượng tử tự động, và đánh giá cơ sở sử dụng nhiều mô hình mã nguồn mở trong quy trình Tạo ra Tăng cường Truy xuất (RAG). Kết quả thử nghiệm chứng minh rằng việc kết hợp RAG và PennyLang cải thiện đáng kể hiệu suất của các mô hình Qwen 7B và LLaMa 4. Điều này trái ngược với các nghiên cứu trước đây tập trung vào Qiskit, góp phần thúc đẩy sự phát triển lượng tử được hỗ trợ bởi AI bằng cách cung cấp các công cụ dựa trên LLM và các phương pháp có thể tái tạo cho PennyLane.