Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Inferix: A Block-Diffusion based Next-Generation Inference Engine for World Simulation

Created by
  • Haebom
Category
Empty

저자

Inferix Team, Tianyu Feng, Yizeng Han, Jiahao He, Yuanyu He, Xi Lin, Teng Liu, Hanfeng Lu, Jiasheng Tang, Wei Wang, Zhiyuan Wang, Jichao Wu, Mingyang Yang, Yinghao Yu, Zeyu Zhang, Bohan Zhuang

개요

Inferix는 에이전트 AI, 구현 AI, 게임과 같은 분야에서 핵심 시뮬레이터 역할을 하는 세계 모델을 위한 차세대 추론 엔진입니다. 반자기 회귀 (블록-확산) 디코딩 패러다임을 사용하여 장기간의 물리적으로 현실적이고 상호 작용적인 고품질 비디오를 생성합니다. Inferix는 LLM 스타일의 KV 캐시 관리를 재도입하여 효율적이고 가변 길이의 고품질 생성을 가능하게 합니다. 또한, 상호 작용적인 비디오 스트리밍 및 프로파일링, LV-Bench 통합을 통해 실시간 상호 작용 및 현실적인 시뮬레이션을 지원합니다.

시사점, 한계점

시사점:
에이전트 AI, 구현 AI, 게임 분야의 세계 모델 발전에 기여.
반자기 회귀 디코딩 방식을 통해 일관성 있고 안정적인 비디오 시퀀스 생성.
LLM 스타일 KV 캐시 관리로 효율적인 가변 길이 고품질 비디오 생성 가능.
상호 작용적인 비디오 스트리밍 및 LV-Bench 통합을 통한 현실적인 시뮬레이션 및 효율적인 벤치마킹 지원.
한계점:
고정된 한계점은 논문 내용에 명시되지 않음.
👍