MedEBench는 의료 영상에 대한 텍스트 기반 이미지 편집을 평가하기 위한 포괄적인 벤치마크입니다. 70개의 과제에 걸쳐 13개의 해부학적 영역에서 임상적으로 출처를 확인한 1,182개의 이미지-프롬프트 삼중항으로 구성됩니다. 편집 정확도, 문맥 보존 및 시각적 품질을 다루는 임상적으로 관련성 있는 평가 프레임워크, 7개의 최첨단 모델에 대한 체계적인 비교, 그리고 어텐션 지도와 ROI 간의 IoU를 사용한 오류 분석 프로토콜을 제공합니다. 이는 신뢰할 수 있고 임상적으로 의미 있는 의료 이미지 편집 시스템을 개발하고 평가하기 위한 견고한 기반을 제공합니다.