본 논문은 텍스트-이미지 생성 AI 안전성 연구에 사용되는 주요 데이터셋들을 종합적으로 검토한 연구입니다. 데이터셋의 수집 방법, 구성, 프롬프트의 의미 및 구문 다양성, 데이터셋 내 유해 유형의 질, 범위 및 분포 등을 자세히 분석합니다. 데이터셋의 강점과 한계를 강조하여 연구자들이 자신들의 연구 목적에 가장 적합한 데이터셋을 선택하고, 특히 모델 안전성 및 윤리적 고려 사항과 관련하여 데이터셋 분포가 연구 결과에 미치는 영향을 비판적으로 평가하며, 향후 연구에서 해결해야 할 데이터셋 범위 및 품질의 격차를 파악할 수 있도록 돕습니다.