RT-cache는 거대 데이터 검색과 경험 학습을 활용하여 실세계 로봇 추론을 가속화하는 새로운 trajectory memory pipeline입니다. 기존의 Vision-Language-Action (VLA) 모델은 다양한 로봇 작업을 처리할 수 있지만, 높은 단계별 추론 비용으로 인해 상당한 지연 시간(작업당 수 분)이 발생합니다. RT-cache는 이전에 성공적인 로봇 trajectory를 대규모로 저장하고 관련된 다단계 동작 조각을 검색하여 추론 오버헤드를 크게 줄입니다. Memory Builder와 Trajectory Retrieval을 통합하여 매우 큰 데이터셋에서도 실행 가능한 효율적인 검색 프로세스를 개발했습니다. RT-cache는 실세계 경험을 유연하게 축적하고 현재 장면이 과거 상태와 일치할 때마다 재생하여, 소량의 추가 샘플만으로 새로운 환경이나 보지 못한 환경에도 빠르게 적응합니다. Open-X Embodiment Dataset 및 기타 실세계 데이터에 대한 실험 결과, RT-cache는 검색 기능이 없는 기준 모델보다 작업을 더 빠르고 성공적으로 완료하여 실시간 조작을 위한 실용적이고 데이터 중심적인 솔루션임을 시사합니다.