본 연구는 비전 트랜스포머(ViTs)의 이미지 분류 성능에 대한 의미 범주 확장의 영향을 조사합니다. Jina AI가 제공하는 CLIP 서버를 사용하여 실험을 진행하였으며, 의미적으로 동등한 범주의 수가 증가함에 따라 ViTs의 라벨링 정확도가 향상되다가 이론적 최대치 또는 한계에 도달할 것이라는 가설을 세웠습니다. 다양한 이미지 데이터셋을 사용하여 가설을 검증하였고, 데이터셋 간 형식 차이를 고려하여 모델의 정확도를 평가하는 Python의 사용자 정의 함수를 통해 데이터를 처리했습니다. 새로운 중복 범주를 기하급수적으로 추가하여 정확도 추세가 안정화되거나 감소 또는 불규칙적으로 변동할 때까지 평가하였습니다. 연구 결과, 의미 확장은 초기에는 모델 성능을 향상시키지만, 특정 임계값을 넘어서면 그 이점이 감소하거나 반전됨을 보여주어 ViTs에 대한 범주 라벨링 전략의 한계와 최적화 가능성에 대한 통찰력을 제공합니다.