본 논문은 대규모 언어 모델(LLM) 기반 하이브리드 검색 시스템의 속도 향상을 위한 LightRetriever를 제안한다. 기존 LLM 기반 하이브리드 검색은 질의와 문서를 LLM을 이용하여 벡터로 인코딩하고, 벡터 유사도를 기반으로 관련 문서를 검색하는데, 온라인 질의 인코딩에 많은 자원을 필요로 한다는 한계가 있다. LightRetriever는 문서 인코딩에는 기존과 같이 대규모 LLM을 사용하지만, 질의 인코딩 과정을 단순한 임베딩 조회(embedding lookup)로 경량화하여 속도를 크게 향상시킨다. GPU 가속 시 1000배 이상, GPU 미사용 시에도 20배 이상의 속도 향상을 달성하며, 성능 저하 또한 평균 5% 미만으로 유지한다는 실험 결과를 제시한다.