본 논문은 대규모 언어 모델(LLMs)을 활용하여 기후변화 적응 전략을 개선하기 위한 연구를 제시합니다. 고품질 데이터셋 구축의 어려움과 적절한 벤치마크 부재로 인해 LLMs의 효과성이 충분히 탐구되지 못한 현실을 인지하고, 지역 신문에 기록된 기후 관련 사건들을 활용하여 4단계의 정교한 파이프라인을 통해 '파괴적 기상 영향 데이터셋'을 구축합니다. 이를 바탕으로, LLMs의 파괴적 기상 영향 이해 능력을 평가하기 위한 최초의 벤치마크인 WXImpactBench를 제안합니다. WXImpactBench는 다중 레이블 분류와 순위 기반 질의응답 두 가지 평가 과제를 포함하며, 다양한 LLMs에 대한 실험을 통해 파괴적 기상 영향 이해 및 기후변화 적응 시스템 개발의 과제를 분석합니다. 구축된 데이터셋과 평가 프레임워크 코드를 공개하여 사회적 재난 취약성 완화에 기여하고자 합니다.