LLM(Large Language Models)이 복잡한 물리 시스템의 수치 실험 자동화에 활용되는 것을 탐구하기 위해, CFD(Computational Fluid Dynamics)를 대상으로 하는 CFDLLMBench를 소개합니다. CFDLLMBench는 CFDQuery, CFDCodeBench, FoamBench로 구성되며, CFD 지식, 수치적/물리적 추론, CFD 워크플로우 구현 능력을 평가합니다. 실제 CFD 관행에 기반하여 코드 실행 가능성, 솔루션 정확도, 수치적 수렴 행동을 평가하며, 수치 실험 자동화를 위한 LLM 개발 및 평가의 기반을 마련합니다.