SPGrasp는 동적 물체에 대한 실시간 상호작용 그립 합성을 위한 새로운 프레임워크입니다. 기존 방법들이 낮은 지연 시간 추론과 프롬프트 가능성을 동시에 달성하는 데 어려움을 겪는 문제를 해결하기 위해, 비디오 스트림 그립 추정을 위해 SAMv2를 확장하는 방법을 제시합니다. 사용자 프롬프트와 시공간적 맥락을 통합하여 최대 59ms의 엔드-투-엔드 지연 시간으로 실시간 상호 작용을 가능하게 하며, 동적 물체에 대한 시간적 일관성을 보장합니다. OCID 및 Jacquard 데이터셋에서 높은 정확도(각각 90.6%, 93.8%)를 달성했으며, GraspNet-1Billion 데이터셋에서도 기존 최고 성능 모델보다 58.5% 향상된 73.1ms의 프레임당 지연 시간과 92.0%의 정확도를 기록했습니다. 실제 13개의 움직이는 물체를 대상으로 한 실험에서 94.8%의 성공률을 달성하여 동적 그립 합성에서 지연 시간과 상호 작용 간의 절충을 효과적으로 해결함을 보여줍니다.