본 논문은 도로 현장 데이터셋을 이용한 도시 물체 및 사건(예: 침수) 탐지의 어려움, 특히 신뢰할 수 있는 레이블 부족 문제를 해결하기 위해 BayFlood라는 두 단계 접근 방식을 제안합니다. 첫째, 사전 훈련된 시각-언어 모델(VLM)을 사용하여 사건 발생 위치에 대한 제로샷 분류를 수행하고, 둘째, VLM 분류 결과에 공간 베이지안 모델을 적합시킵니다. 제로샷 접근 방식은 대규모 훈련 세트 주석의 필요성을 없애고, 베이지안 모델은 불확실성 측정, 위치 간 평활화, 강우량 누적 지역과 같은 외부 데이터 통합 등 도시 환경에서 요구되는 여러 장점을 제공합니다. 다양한 도시와 기간에 걸쳐 VLM이 홍수에 대한 강력한 제로샷 신호를 제공하고, 베이지안 모델이 기준 방법에 비해 샘플 외 예측을 개선하며, 추론된 홍수 위험이 알려진 외부 위험 예측 변수와 상관관계가 있음을 보여줍니다. 이 접근 방식을 검증한 후, 기존 방법으로 간과된 113,738명의 홍수 고위험군을 밝히고, 기존 방법의 인구 통계적 편향을 식별하며, 새로운 홍수 센서 설치 위치를 제안하는 등 도시 홍수 감지를 개선하는 데 활용할 수 있음을 보여줍니다. 결론적으로, 베이지안 모델링과 제로샷 LM 주석의 결합은 대규모 레이블 데이터 수집을 피하고 기본 모델의 성능을 활용하면서 베이지안 모델의 표현력과 불확실성 정량화 기능을 제공하는 유망한 패러다임임을 보여줍니다.