확산 모델은 이미지 생성 분야에서 최첨단 기술로 부상했지만, 반복적인 노이즈 제거 과정에서 발생하는 높은 계산 비용으로 인해 실제 배포에 어려움을 겪고 있다. H2-Cache는 이러한 한계를 해결하기 위해 제안된 새로운 계층적 캐싱 메커니즘으로, 노이즈 제거 과정을 구조 정의 단계와 세부 묘사 단계로 분리하는 핵심 아이디어를 기반으로 한다. 독립적인 임계값을 사용하여 각 단계를 선택적으로 캐싱하는 이중 임계값 시스템을 활용하며, 효율적인 유사성 추정을 위해 Pooled Feature Summarization (PFS)을 도입한다. Flux 아키텍처에 대한 실험 결과, H2-Cache는 기존 캐싱 방식보다 이미지 품질 저하 없이 최대 5.08배의 가속을 달성했다.