본 논문은 대화형 분할(interactive segmentation)이 체적 의료 영상 분할 알고리즘 구축에 유망한 전략임을 언급하며, 일관성 없는 평가 방식이 공정한 비교를 방해하고 실제 성능을 오해하게 만든다고 지적한다. 이에 따라 임상적으로 타당한 평가 작업 및 지표 정의 방법을 제안하고, 표준화된 평가 파이프라인을 구축하기 위한 소프트웨어 프레임워크를 개발했다. 최신 알고리즘들을 다양한 과제에 걸쳐 평가한 결과, 사용자 상호작용 처리 시 정보 손실 최소화, 적응형 줌 메커니즘의 중요성, 훈련과 검증 프롬프트의 일관성, 2D 및 3D 방법의 성능 차이, 그리고 비의료 도메인 모델의 성능 저하 등을 관찰했다.