본 논문은 재난 구조 상황에서 인간-로봇 상호작용(HRI)에 있어 대규모 언어 모델(LLM)의 물리적 추론 능력 활용 가능성을 제시한다. 기존 대형 LLM의 크기 제약 문제를 해결하기 위해, Field Reasoning and Instruction Decoding Agent (FRIDA) 모델을 생성하는 데이터셋과 파이프라인을 제안한다. 도메인 전문가와 언어학자의 지식을 결합하여 고품질의 몇 샷 프롬프트를 생성하고, 이를 통해 합성 데이터를 만들어 소형 instruction-tuned 모델을 미세 조정한다. 물체의 물리적 상태와 기능 데이터만으로 학습한 FRIDA 모델이 모든 합성 데이터로 학습한 모델 및 기본 모델보다 성능이 우수함을 실험적으로 보여주며, 최소한의 데이터로 물리적 상식을 주입할 수 있음을 입증한다.