본 논문은 기초 모델(FM) 기반 로봇을 현장 환경에 배치하는 문제를 다룹니다. 기존의 FM 기반 로봇은 주로 사전 지도가 완벽하게 제공되거나 작업 공간 전체가 보이는 폐쇄된 환경에서 작동하지만, 현장 로봇은 대규모 비구조화 환경에서 작동해야 합니다. 본 논문은 연구진이 개발한 LLM 기반 자율 주행 프레임워크인 SPINE을 현장 로봇 환경에 배치한 결과를 제시합니다. 수 킬로미터에 달하는 임무를 수행하는 비구조화 환경에서 대규모 LLM 기반 로봇 계획의 첫 번째 시연을 선보이며, SPINE은 특정 LLM에 종속되지 않아 크기, 무게, 전력(SWaP) 제약이 있는 플랫폼에서 작동하는 소형 언어 모델을 증류할 수 있음을 보여줍니다. 또한, 기기 내 언어 모델을 사용한 최초의 언어 기반 UAV 계획기를 제시하고, 향후 연구 방향을 제안합니다.