본 논문은 양자 소프트웨어 개발, 특히 PennyLane 프레임워크를 위한 대규모 언어 모델(LLM) 기반 코드 지원 시스템 개발을 위한 새로운 고품질 데이터셋을 제시합니다. 3,347개의 PennyLane 관련 코드 샘플과 이에 대한 설명으로 구성된 이 데이터셋은 양자 컴퓨팅 교과서, 공식 문서, 오픈소스 저장소를 활용하여 자동 생성되었으며, LLM 학습 효율을 극대화하기 위한 체계적인 데이터 정제, 주석 및 형식 지정 방법론을 통해 개발되었습니다. Retrieval-Augmented Generation (RAG) 프레임워크를 기반으로 한 평가를 통해, 본 데이터셋이 PennyLane 코드 생성을 간소화하고 양자 개발 워크플로우를 개선하는 데 효과적임을 보여줍니다. 기존 Qiskit 중심의 연구와 달리, 다양한 양자 프레임워크를 지원하는 코드 지원 시스템 개발에 기여합니다.