본 연구는 사고를 유발할 수 있는 위험한 상황의 사실적인 이미지를 생성하기 위해, 역사적인 OSHA 사고 보고서를 기반으로 하는 새로운 장면 그래프 기반 생성 AI 프레임워크를 제시합니다. GPT-4o를 사용하여 OSHA 보고서에서 구조화된 위험 요소를 추출하고, 이를 객체 수준의 장면 그래프로 변환하여 위험을 이해하는 데 필요한 공간적 및 상황적 관계를 캡처합니다. 이러한 그래프는 텍스트-이미지 확산 모델을 안내하여 구성적으로 정확한 위험 장면을 생성합니다. 생성된 데이터의 사실성과 의미 충실도를 평가하기 위해 시각적 질문 응답(VQA) 프레임워크를 도입합니다. 네 가지 최첨단 생성 모델에서 제안된 VQA Graph Score는 엔트로피 기반 유효성을 바탕으로 CLIP 및 BLIP 메트릭보다 우수한 성능을 보이며, 높은 식별 감도를 확인합니다.