본 논문은 양자 소프트웨어 개발에 있어 대규모 언어 모델(LLM)의 활용을 제한하는 고품질 데이터셋의 부재 문제를 해결하기 위해 PennyLane 전용 고품질 데이터셋인 PennyLang을 제시합니다. PennyLang은 교과서, 공식 문서, 오픈소스 저장소에서 수집된 3,347개의 PennyLane 양자 코드 샘플과 상황 설명으로 구성됩니다. 본 논문은 PennyLang의 생성 및 공개, 자동화된 양자 코드 데이터셋 구성 프레임워크, 그리고 RAG(Retrieval-Augmented Generation) 파이프라인 내에서 여러 오픈소스 모델을 이용한 기준 평가를 포함한 세 가지 기여를 제시합니다. 실험 결과, RAG와 PennyLang을 함께 사용하면 Qwen 7B와 LLaMa 4 모델의 성능이 크게 향상됨을 보여줍니다. 이는 Qiskit에 집중된 기존 연구와 달리, PennyLane에 LLM 기반 도구와 재현 가능한 방법을 제공하여 AI 지원 양자 개발을 발전시키는 데 기여합니다.