본 논문은 미국 소비자 제품 안전위원회(CPSC)의 리콜 데이터베이스를 활용하여 다중 모달 데이터셋 RECALL-MM을 구축하고, 생성적 방법을 이용하여 이를 증강함으로써 데이터 기반 위험 평가를 수행하는 연구입니다. RECALL-MM 데이터셋의 패턴 분석을 통해 안전 조치 개선이 필요한 영역을 특정하고, 리콜 설명과 제품 이름을 기반으로 모든 리콜을 공유 잠재 공간에 포함하는 대화형 클러스터링 맵을 개발했습니다. 세 가지 사례 연구를 통해 데이터셋의 유용성을 보여주는데, 첫 두 사례 연구는 설계자가 리콜된 제품의 패턴을 시각화하고 새로운 제품 아이디어를 더 넓은 리콜 환경 내에 위치시켜 위험을 사전에 예측하는 방법을 보여줍니다. 세 번째 사례 연구에서는 대규모 언어 모델(LLM)을 사용하여 제품 이미지만으로 잠재적 위험을 예측하는 방법을 보여주며, 이는 모델이 시각적 맥락을 활용하여 위험 요소를 식별하고 많은 위험 범주에서 과거 리콜 데이터와 강한 일치성을 보임을 보여줍니다. 하지만 위험 예측이 어려운 영역도 강조하여 설계 과정 전반에 걸친 위험 인식의 중요성을 강조합니다. 결론적으로 본 연구는 과거 리콜 데이터와 미래 제품 안전 간의 간극을 해소하고, 더 안전한 엔지니어링 설계를 위한 확장 가능한 데이터 기반 접근 방식을 제시합니다.