본 논문은 에너지 기반 변환기(Energy-Based Transformer, EBT)를 기반으로 하는 새로운 정책 아키텍처인 EBT-Policy를 소개합니다. EBT-Policy는 계산 비용 절감, 노출 편향 감소, 안정적인 추론 역학을 통해 로봇 공학의 핵심 과제를 해결합니다. 시뮬레이션 및 실제 세계 작업에서 확산 기반 정책보다 성능이 우수하며, 더 적은 훈련 및 추론 계산이 필요합니다. 또한, 실패한 작업 시퀀스로부터 제로샷 복구와 같은 새로운 기능을 보여줍니다. EBT-Policy는 불확실성을 고려한 추론 및 동적 컴퓨팅 할당을 통해 분포 변화에 강건하고 일반화 가능한 로봇 행동을 가능하게 합니다.