본 논문은 휴머노이드 로봇이 자유 형식의 언어 명령을 따르도록 하는 데 필요한 기술을 소개합니다. 특히, Humanoid-LLA라는 대형 언어 행동 모델을 제안하여, 복잡한 언어 명령을 실제 실행 가능한 로봇의 전신 동작으로 변환합니다. 이 모델은 인간과 로봇 동작을 통합하는 동작 어휘, 물리적 실행 가능성을 보장하는 컨트롤러, 강화 학습을 통한 안정성 향상을 위한 단계를 포함합니다. 시뮬레이션 및 실제 Unitree G1 휴머노이드 로봇 실험을 통해 기존 방식보다 높은 자연스러움, 안정성 및 성공률을 달성했음을 보여줍니다.