재단 모델을 이용한 검색 증강 생성(RAG)은 다양한 작업에서 강력한 성능을 보였지만, 올림피아드 수준의 물리학 문제를 푸는 것과 같은 전문가 수준의 추론 능력은 아직 충분히 탐구되지 않았다. 과거 문제 검토를 통해 경쟁을 준비하는 학생들의 방식에서 영감을 받아, 재단 모델에서 RAG가 물리학적 추론을 향상시킬 수 있는 잠재력을 연구한다. 검색 기반 추론을 체계적으로 연구할 수 있도록 특별히 설계된 고품질 멀티모달 데이터셋 PhoPile을 소개한다. PhoPile은 그림, 그래프, 방정식을 포함하여 물리학 문제 해결의 본질적인 멀티모달 특성을 포착한다. PhoPile을 사용하여, 여러 검색기를 갖춘 대규모 언어 모델(LLM)과 대규모 멀티모달 모델(LMM)을 모두 포함하는 RAG 증강 재단 모델을 벤치마킹한다. 우리의 결과는 물리학 코퍼스와 검색을 통합하면 모델 성능을 향상시킬 수 있으며, 검색 증강 물리학 추론에 대한 추가 연구를 촉진하는 과제를 강조한다는 것을 보여준다.