MedEBench는 의료 영상에 대한 텍스트 기반 편집을 평가하기 위한 종합적인 벤치마크입니다. 13개의 해부학적 영역에 걸쳐 70개의 작업을 포함하는 1,182개의 임상적으로 얻어진 이미지-프롬프트 삼중항으로 구성됩니다. 편집 정확도, 문맥 보존, 시각적 품질을 다루는 임상적으로 관련성 있는 평가 프레임워크, 7개의 최첨단 모델에 대한 체계적인 비교, 그리고 어텐션 매핑과 ROI 간의 IoU를 사용한 오류 분석 프로토콜을 제공합니다. 수술 결과 시뮬레이션, 개인화된 교육 자료 생성, 환자 의사소통 향상 등 임상적 적용 가능성이 높습니다.