본 논문은 다양한 환경에서 다양한 물체와 상호작용해야 하는 지능형 로봇을 위해, 상변화와 같은 복잡한 변화를 겪는 동적 물체의 분할 문제를 다룹니다. 기존 비전 분야에서 상변화를 고려한 동적 물체 분할 연구가 부족하다는 점을 지적하며, 시각적 특징 및 형태 및 외관 변화 가능성에 따라 실제 물체를 범주화하는 '상(phase)' 개념을 도입합니다. 다양한 일상 시나리오(10개)를 포함하는 479개의 고해상도 비디오로 구성된 새로운 벤치마크 M$^3$-VOS (Multi-Phase, Multi-Transition, and Multi-Scenery Video Object Segmentation)를 제시합니다. M$^3$-VOS는 물체의 상과 상변화를 모두 포착하는 밀집 인스턴스 마스크 주석을 제공하며, 최첨단 방법들을 평가하여 외관 기반 접근 방식이 상변화를 갖는 물체 처리에 개선의 여지가 큼을 보여줍니다. 상변화의 본질적인 무질서 변화를 고려하여, 역 엔트로피 감소 과정을 통해 순방향 엔트로피 증가 과정의 예측 성능을 향상시킬 수 있음을 제안하고, 성능을 역방향 개선으로 향상시키는 새로운 플러그 앤 플레이 모델 ReVOS를 제안합니다. 데이터와 코드는 공개적으로 제공됩니다.