본 논문은 Large Language Model (LLM)의 추론 시 관련 문맥 정보를 제공하여 생성 품질을 향상시키는 방법을 제시한다. 기존에는 외부 지식베이스에서 검색된 문맥 정보를 입력에 추가하는 방식을 사용했지만, 이는 계산 비용이 많이 드는 문제점이 있었다. 본 논문은 State Space Model (SSM)을 활용하여 여러 문맥 정보를 고정된 차원의 상태로 매핑하고, 이를 통해 생성을 시작하는 방법을 제안한다. 특히, 여러 문맥 정보를 효율적으로 활용하기 위해 SSM 동역학에서 유도된 수학적 관계를 이용하여 여러 상태를 하나의 상태로 합성하는 기법을 제시한다. 문맥 순서의 정보가 유용하지 않을 수 있으므로, 모든 가능한 순서에 대해 상태를 평균화하여 순열 불변성을 보장한다. WikiText와 MSMARCO 데이터셋에서 제안된 방법을 평가한 결과, 기존 최고 성능의 기준 모델과 유사한 성능을 달성하면서 평균 5.4배의 속도 향상을 보였다.