본 논문은 대규모 언어 모델(LLM)의 핵심 기능인 임베딩에 대한 연구를 다룬다. 텍스트 데이터를 풍부하고 밀집된 수치 표현으로 변환하여 의미적 및 구문적 속성을 캡처하는 임베딩은 LLM의 장기 기억 역할을 하며, 광범위한 자연어 처리 작업을 효율적으로 처리할 수 있게 한다. 그러나 임베딩 벡터 데이터베이스의 인기가 높아짐에 따라 개인 정보 유출에 대한 우려도 커지고 있으며, 특히 임베딩 역전 공격에 취약하다. 기존 방어 메커니즘은 보안과 성능 사이의 균형을 맞추는 데 어려움을 겪었다. 이러한 문제를 해결하기 위해, 본 논문은 임베딩 역전 공격을 완화하도록 설계된 새로운 방어 메커니즘인 Eguard를 제안한다. Eguard는 트랜스포머 기반의 투영 네트워크와 텍스트 상호 정보 최적화를 사용하여 LLM의 유용성을 유지하면서 임베딩을 보호한다.