본 논문은 온라인 대규모 언어 모델(LLM) 추론 서비스의 광범위한 사용으로 인해 사용자 입력의 개인 정보가 악의적인 도청자에게 노출될 가능성에 대한 심각한 우려가 제기됨에 따라, 기존의 LLM 개인 정보 보호 방법들이 개인 정보 보호, 성능 저하 또는 추론 시간 오버헤드 증가 문제를 가지고 있음을 지적합니다. 이러한 한계를 해결하기 위해, 본 논문에서는 LLM 추론 중 사용자 입력의 개인 정보를 보호하는 플러그 앤 플레이 방식인 PrivacyRestore를 제안합니다. PrivacyRestore는 개인 정보가 포함된 연속적인 토큰 시퀀스인 개인 정보 범위(privacy span)에 대한 복원 벡터를 서버에서 훈련한 후 클라이언트에 제공합니다. 클라이언트는 입력에서 모든 개인 정보 범위의 복원 벡터를 단일 메타 복원 벡터로 집계하여 개인 정보 범위를 제거한 입력과 함께 서버로 전송합니다. 추론 중 활성화 조향(activation steering)을 통해 개인 정보가 복원됩니다. 또한, PrivacyRestore는 개인 정보 예산의 선형 성장을 방지함을 증명합니다. 의료 및 법률 영역을 포함하는 세 가지 데이터 세트를 생성하여 개인 정보 보호 방법의 효과를 평가하였으며, 실험 결과 PrivacyRestore가 개인 정보를 효과적으로 보호하고 허용 가능한 수준의 성능과 추론 오버헤드를 유지함을 보여줍니다.