본 논문은 소프트웨어 품질 연구에 사용될 수 있는 대규모 데이터셋인 SQuaD(Software Quality Dataset)를 소개한다. SQuaD는 Apache, Mozilla, FFmpeg, Linux kernel 등 다양한 생태계의 450개 성숙된 오픈소스 프로젝트에서 추출된 시계열, 다차원 소프트웨어 품질 지표를 포함한다. SonarQube, CodeScene, PMD, Understand, CK, JaSoMe, RefactoringMiner, RefactoringMiner++, PyRef 등 9개의 정적 분석 도구를 통합하여 메서드, 클래스, 파일 및 프로젝트 수준에서 700개 이상의 고유 지표를 제공한다. 총 63,586개의 프로젝트 릴리스를 다루며, 버전 관리, 이슈 추적 기록, 소프트웨어 취약성 데이터 (CVE/CWE) 및 JIT (Just-In-Time) 결함 예측을 향상시키는 프로세스 지표도 제공한다. SQuaD는 유지 보수성, 기술 부채, 소프트웨어 진화 및 품질 평가에 대한 실증적 연구를 가능하게 하며, 자동화된 데이터셋 업데이트 및 교차 프로젝트 품질 모델링과 같은 연구 방향을 제시한다. 데이터셋은 ZENODO (DOI: 10.5281/zenodo.17566690)에서 공개적으로 이용 가능하다.