Behavior from Language and Demonstration (BLADE)는 모방 학습과 모델 기반 계획을 통합하여 장기간 로봇 조작을 위한 프레임워크입니다. BLADE는 언어로 주석이 달린 시범을 활용하고, 대규모 언어 모델(LLM)에서 추상적인 행동 지식을 추출하여 구조화된 고수준 행동 표현 라이브러리를 구성합니다. 이러한 표현에는 각 고수준 행동에 대한 시각적 인식에 기반한 전제 조건과 효과뿐 아니라 신경망 기반 정책으로 구현된 해당 컨트롤러가 포함됩니다. BLADE는 수동으로 라벨이 지정된 상태 또는 기호 정의 없이 이러한 구조화된 표현을 자동으로 복구할 수 있습니다. BLADE는 새로운 초기 상태, 외부 상태 변동 및 새로운 목표를 포함한 새로운 상황으로의 일반화에서 상당한 기능을 보여줍니다. 시뮬레이션과 관절 부품, 부분 관측 가능성 및 기하학적 제약이 있는 다양한 객체를 사용한 실제 로봇에서 접근 방식의 효과를 검증했습니다.