본 논문은 빌딩의 난방, 환기, 공조(HVAC) 시스템 제어에 대한 데이터 기반 접근법으로, 특히 다양한 HVAC 시스템에 걸쳐 일반화 성능이 제한적이고 샘플 효율이 낮은 강화 학습(RL)의 한계를 극복하기 위해 모델 기반 강화 학습 프레임워크를 제시한다. 이 프레임워크는 하이퍼네트워크를 사용하여 서로 다른 행동 공간을 가진 작업에 걸쳐 환경 역학을 지속적으로 학습함으로써 효율적인 합성 롤아웃 생성 및 향상된 샘플 사용을 가능하게 한다. 연속 학습 환경에서 두 번째 작업에 대한 훈련 후 강력한 역방향 전이를 보여주며, 첫 번째 작업에 대한 최소한의 미세 조정으로 단 5 에피소드 내에 빠른 수렴을 달성하여 모델 프리 강화 학습(MFRL)을 능가하고 파국적 망각을 효과적으로 완화한다. 이는 건물 관리의 에너지 소비 및 운영 비용 절감, 나아가 지속 가능한 발전 목표 달성에 중요한 의미를 가진다.