본 논문은 전문적인 응용 분야에서 필요한 길고 상세한 프롬프트를 처리하는 텍스트-이미지(T2I) 모델의 능력을 평가하기 위해 특별히 고안된 첫 번째 종합적인 벤치마크인 DetailMaster를 제시합니다. DetailMaster는 문자 속성, 구조화된 문자 위치, 다차원 장면 속성, 명시적인 공간/상호 작용 관계라는 네 가지 중요한 평가 차원을 도입합니다. 평균 284.89 토큰의 길고 상세한 프롬프트로 구성되며, 전문가에 의해 검증된 높은 품질을 자랑합니다. 7개의 범용 T2I 모델과 5개의 장 프롬프트 최적화 T2I 모델에 대한 평가 결과, 속성 결합 및 공간 추론과 같은 주요 차원에서 최첨단 모델의 정확도는 약 50%에 불과하며, 모든 모델에서 프롬프트 길이가 증가함에 따라 성능이 점진적으로 저하되는 것을 보여줍니다. 본 논문은 구조적 이해 및 세부 정보 과부하 처리의 시스템적 결함을 강조하며, 향상된 구성적 추론을 갖춘 아키텍처에 대한 미래 연구를 촉구합니다. 데이터셋, 데이터 관리 코드 및 평가 도구를 오픈 소스로 공개하여 상세한 T2I 생성을 발전시키고, 전용 벤치마크 부족으로 인해 불가능했던 광범위한 응용 프로그램을 가능하게 합니다.