# Inferix: A Block-Diffusion based Next-Generation Inference Engine for World Simulation

### 저자

Inferix Team, Tianyu Feng, Yizeng Han, Jiahao He, Yuanyu He, Xi Lin, Teng Liu, Hanfeng Lu, Jiasheng Tang, Wei Wang, Zhiyuan Wang, Jichao Wu, Mingyang Yang, Yinghao Yu, Zeyu Zhang, Bohan Zhuang

### 💡 개요

본 논문은 물리적으로 사실적이고 상호작용 가능한 고품질 비디오 생성을 위한 차세대 추론 엔진인 Inferix를 제안합니다. Inferix는 블록 기반 확산 모델링(block-diffusion)과 LLM 스타일 KV 캐시 관리를 결합한 반자율(semi-autoregressive) 디코딩 패러다임을 사용하여 효율적이고 고품질의 가변 길이 비디오 생성을 가능하게 합니다. 이를 통해 에이전트 AI, 체화 AI, 게임 등 다양한 분야에서 몰입감 있는 월드 시뮬레이션을 지원하는 것을 목표로 합니다.

### 🔑 시사점 및 한계

- **차세대 월드 시뮬레이션 엔진:** Inferix는 기존의 고동시성(high-concurrency) 추론 시스템이나 일반적인 비디오 확산 모델과는 달리, 월드 시뮬레이션 자체에 최적화된 반자율 디코딩 프로세스를 제공합니다.

- **효율적이고 고품질 비디오 생성:** 블록 기반 확산 모델링과 KV 캐시 관리의 결합을 통해 일관성 있고 안정적인 장기 비디오 생성이 가능하며, LLM처럼 효율적인 추론을 지원합니다.

- **실시간 상호작용 및 평가 지원:** 인터랙티브 비디오 스트리밍 기능과 LV-Bench 통합을 통해 실시간 상호작용과 정밀한 비디오 생성 성능 평가를 지원합니다.

- **한계점/향후 과제:** 현재는 월드 시뮬레이션에 특화되어 있어 일반적인 고동시성 추론 시스템과의 직접적인 비교는 제한적일 수 있으며, 커뮤니티와의 협력을 통해 Inferix의 발전과 월드 모델 탐색을 촉진하는 것이 향후 과제입니다.

---

[PDF 보기](https://arxiv.org/pdf/2511.20714)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
