Aurora와 같은 대규모 기상 예측 모델은 높은 정확도를 보이지만, 내부 표현이 불투명하여 운영 환경에서 채택에 어려움이 있다. 본 연구는 Aurora의 인코더가 물리적 및 기상학적 개념과 일치하는지 조사하여 물리적 일관성을 탐구한다. 대규모 임베딩 데이터셋을 사용하여, 토지-바다 경계, 고온 극심 기상 현상, 대기 불안정을 식별하는 선형 분류기를 훈련시켰다. Aurora가 물리적으로 일관된 특징을 학습한다는 정량적 증거를 제시하며, 드문 현상을 포착하는 데 한계가 있음을 강조한다. AI 기반 차세대 기상 모델의 신뢰성을 구축하기 위해 해석 가능성 방법의 중요성을 강조한다.