본 논문에서는 다양한 지형과 로봇 형태에 걸쳐 실시간 적응이 필요한 연속적인 역학 시스템의 4족 보행 로봇 제어 문제를 해결하기 위해, 오프라인 데이터만을 사용하여 다양한 4족 보행 로봇과 지형에 걸쳐 단일 일반화 보행 정책을 학습하는 확장 가능한 어텐션 기반 프레임워크인 GROQLoco를 제안합니다. GROQLoco는 계단 오르기(비주기적 보행)와 평지 보행(주기적 보행)이라는 두 가지 다른 보행 행동의 전문가 데모를 여러 4족 보행 로봇에서 수집하여 두 행동 모두를 위한 행동 융합을 가능하게 하는 일반화 모델을 훈련합니다. 로봇 특정 인코딩 없이 모든 로봇의 고유수용성 데이터를 직접 사용하며, Intel i7 nuc에서 직접 배포 가능하고 테스트 시간 최적화 없이 낮은 지연 시간 제어 출력을 생성합니다. Unitree Go1과 같은 상용 로봇을 포함한 다양한 4족 보행 로봇과 지형에서 강력한 제로샷 전이를 보여주는 광범위한 실험 결과를 제시하며, 70kg 4족 보행 로봇인 Stoch 5에서의 초기 평지 및 야외 지형 보행 결과도 포함합니다.