의료 분야의 멀티모달 대형 언어 모델(MLLM) 발전을 가로막는 고품질, 논리적으로 주석이 달린 비디오 데이터셋 부족 문제를 해결하기 위해, 저자들은 결정적 그래프 순회 프로세스로 벤치마크 합성을 공식화하는 새로운 신경-기호 데이터 엔지니어링 프레임워크인 \PipelineName을 제시한다. 이 프레임워크는 원시 비디오 스트림에서 구조화된 시각적 기본 요소를 추출하여 동적 시공간 지식 그래프에 인스턴스화한다. 이 그래프 내의 유효한 경로에 쿼리 생성을 고정함으로써, 각 합성 벤치마크 항목에 대한 엄격한 Chain-of-Thought(CoT) 출처를 적용한다. 이 파이프라인을 구현하여 미세한 시간 선택성과 다중 홉 논리적 복잡성을 나타내는 대규모 의료 비디오 추론 벤치마크인 M3-Med-Auto를 생성한다. 자동화된 파이프라인은 전문가가 큐레이팅한 데이터셋과 유사한 복잡성을 가진 쿼리 워크로드를 생성하며, 논리 정렬 분석은 처방된 그래프 토폴로지와 최첨단 MLLM의 추론 단계 간의 높은 상관관계를 보여준다.