본 논문은 자율주행과 같은 실제 환경에서의 장면 흐름(Scene Flow) 추정을 개선하기 위해, 인접한 LiDAR 스캔으로부터 점 단위의 움직임을 복원하는 과정에서 나타나는 문제점을 해결하는 방법을 제시합니다. 특히, 동일한 물체에 속한 가까운 점들은 동일한 움직임을 공유하는 경우가 많으므로, 이러한 국소적 강체 운동 제약 조건을 고려하는 것이 중요합니다. 기존의 자기 지도 학습 방식의 장면 흐름 추정은 후처리 또는 추가 정규화를 통해 이 문제를 해결하려고 시도했지만, 모델 구조 내에 국소적 강체성에 대한 유도적 편향(inductive bias)이 부족하여 학습 효율과 성능이 저하되었습니다. 본 논문에서는 경량의 추가 모듈을 신경망 설계에 통합하여 국소적 강체성을 강화하고, 차별 가능한 투표(differentiable voting) 방식을 사용하여 근처 점들이 공유하는 변환을 식별합니다. 또한 계산 효율을 위해 점이 아닌 pillar 단위로 연산하고, pillar 당 대표적인 특징을 학습합니다. Argoverse 2와 Waymo 데이터셋에서 다양한 모델에 제안된 모듈을 적용하여 실험을 진행, 기존 방법보다 성능을 향상시켰음을 보여줍니다.