본 논문은 AI Video Chat을 위한 실시간 통신(RTC) 연구를 제시하며, 인간-AI 상호 작용의 직관성을 향상시키지만 MLLM 추론의 지연 문제와 네트워크 불확실성으로 인한 전송 지연의 병목 현상을 해결하고자 한다. 이를 위해, AI 중심 RTC 연구를 제안하고, 초저 비트 전송률이 중요함을 확인하며, 컨텍스트 인식 비디오 스트리밍을 통해 비트 전송률을 줄이는 방법을 제시한다. 또한, MLLM 정확도에 대한 비디오 스트리밍 품질의 영향을 평가하기 위한 Degraded Video Understanding Benchmark (DeViBench)를 구축하고, AI Video Chat에 대한 열린 질문과 해결책을 논의한다.