본 논문은 효율적이고 비용 효과적인 색인 생성 및 최신 정보 반영의 중요성을 강조하며, 새로운 검색 방식인 SemI-parametric Disentangled Retrieval (SiDR)을 제안합니다. SiDR은 이전의 신경망 기반 검색 방식과 달리, 색인 생성과 신경망 파라미터를 분리하여 파라미터에 의존하지 않는 효율적인 색인 생성을 가능하게 합니다. 임베딩 기반 색인과 비모수적 토큰화 색인을 모두 지원하며, 특히 토큰화 색인을 사용할 경우 BM25와 유사한 복잡도로 색인을 생성하면서 BM25보다 성능이 뛰어납니다. 16개의 검색 벤치마크에 대한 종합적인 평가를 통해, 동일한 색인 작업량 하에서 기존의 신경망 및 용어 기반 검색 방식보다 우수한 성능을 보임을 입증합니다. 임베딩 기반 색인 사용 시 기존 신경망 검색 방식보다 성능이 우수하며, 토큰화 기반 색인 사용 시에는 색인 생성 비용과 시간을 획기적으로 줄이면서 BM25를 능가하는 성능을 보입니다. 또한, BM25의 색인 생성 시간과 동일하면서도 다른 신경망 기반 검색 방식보다 성능이 우수한 후기 파라메트릭 메커니즘을 제시합니다.