본 논문은 대규모 언어 모델(LLM)의 높은 비용 문제를 해결하기 위해 새로운 프롬프트 압축 프레임워크인 프롬프트 중요도 샘플링(PIS)을 제안합니다. PIS는 은닉 상태의 어텐션 점수 분석을 기반으로 중요 토큰을 샘플링하여 프롬프트를 동적으로 압축합니다. 토큰 수준에서는 경량의 9계층 강화 학습(RL) 네트워크를 사용하여 어텐션 점수를 기반으로 중요도를 정량화하고 적응적 압축을 구현하며, 의미 수준에서는 러시안 룰렛 샘플링 전략을 사용하여 문장 수준의 중요도 샘플링을 수행합니다. 다양한 도메인 벤치마크에 대한 종합적인 평가 결과, PIS는 최첨단 압축 성능을 달성하며, 컨텍스트 구조 최적화를 통해 추론 효율성까지 향상시키는 것을 보여줍니다.