본 논문은 장시간 비디오 이해를 위한 시스템-알고리즘 공동 설계인 QuickVideo를 제안합니다. 장시간 비디오 이해는 비디오 감시, 회의 요약, 교육 강의 분석, 스포츠 중계와 같은 실제 응용 분야에서 중요하지만, 순차적인 비디오 디코딩과 많은 토큰의 사전 채우기로 인해 VideoLLM에서 계산적으로 어려움을 겪습니다. QuickVideo는 병렬화된 CPU 기반 비디오 디코더인 QuickDecoder, 메모리 효율적인 사전 채우기 방법인 QuickPrefill, 그리고 CPU 비디오 디코딩과 GPU 추론을 겹치는 오버랩 기법을 통해 이러한 문제를 해결합니다. 실험 결과, QuickVideo는 다양한 길이와 샘플링 속도에 대해 일반화되며, 제한된 하드웨어에서도 확장 가능하고 고품질의 비디오 이해를 가능하게 합니다.