PRISM은 장거리 작업을 위한 새로운 접근 방식으로, 입력 정보를 청크 단위로 처리하면서 타입화된 계층적 스키마로 지정된 구조화된 컨텍스트 내 메모리를 유지합니다. 기존의 장거리 작업 모델들과 달리, 큰 컴퓨팅 비용, 방대한 훈련 데이터, 모델 가중치 접근 또는 복잡한 작업별 설계 없이도 다양한 작업에서 우수한 성능을 보입니다. 특히 기존 장거리 모델보다 최소 4배 짧은 컨텍스트를 사용하며, 토큰 효율적이고 간결한 출력을 생성합니다. 또한 KV 캐시를 효율적으로 활용하여 비용을 최대 54%까지 절감합니다. PRISM은 작은 청크(<500 토큰)에서도 인코딩 비용 증가나 성능 저하 없이 작동하며, 작업 설명으로부터 스키마를 자동 생성하여 새로운 작업에 대한 일반화 능력이 뛰어납니다.