본 논문은 건설 현장 안전 등 안전 중요 응용 분야에서 AI 시스템 훈련을 위한 데이터 부족 문제를 해결하기 위해, 합성 데이터 생성을 위한 새로운 종단간 프레임워크를 제안합니다. 기존 방법들이 합성 장면을 생성할 수 있지만 의미적 깊이가 부족한 한계를 극복하고자, 평가 에이전트(LLM 기반)와 편집 에이전트의 반복적인 협업을 통해 의미적 일관성 및 안전 제약 조건을 충족하는 합성 이미지를 생성하는 다중 에이전트 프레임워크를 제시합니다. LLM의 추론 및 상식적 지식 활용을 통해 안전 중요 시나리오에 맞춘 합성 이미지를 생성하며, 실험 결과 기존 방법의 단점을 해결하고 안전 요구 사항과 시각적 의미를 균형 있게 고려한 유용한 장면을 생성할 수 있음을 보여줍니다.