본 논문은 메타데이터 증강 프롬프트의 영향에 중점을 두고 텍스트-이미지 생성 모델을 위한 오픈소스 통합 벤치마킹 및 평가 프레임워크를 제시합니다. DeepFashion-MultiModal 데이터셋을 활용하여 가중 점수, CLIP 기반 유사도, LPIPS, FID, 검색 기반 측정값 등의 포괄적인 정량적 지표와 정성적 분석을 통해 생성된 출력을 평가합니다. 연구 결과, 구조화된 메타데이터 풍부화는 다양한 텍스트-이미지 아키텍처에서 시각적 현실성, 의미적 충실도 및 모델 강건성을 크게 향상시킨다는 것을 보여줍니다. 전통적인 추천 시스템은 아니지만, 본 프레임워크는 평가 지표를 기반으로 모델 선택 및 프롬프트 설계에 대한 작업별 추천을 가능하게 합니다.