본 논문은 이미지 데이터셋 구축을 위한 새로운 방법인 DatasetAgent를 제안합니다. DatasetAgent는 다중 모달 대규모 언어 모델(MLLM)을 탑재한 4개의 에이전트와 이미지 최적화 도구 패키지를 활용하여 사용자의 요구사항에 맞는 고품질 이미지 데이터셋을 자동으로 구축합니다. 기존 데이터셋 확장 및 새로운 데이터셋 생성이라는 두 가지 실험을 통해 다양한 오픈소스 데이터셋에서 DatasetAgent의 성능을 검증하고, 생성된 데이터셋으로 이미지 분류, 객체 탐지, 이미지 분할 등 다양한 비전 모델을 학습시켰습니다. 수동 데이터 수집 및 주석의 비효율성을 해결하고, 인공지능 생성 데이터보다 실제 데이터의 가치를 높이 평가하여 실제 이미지로부터 데이터셋을 자동으로 구축하는 데 초점을 맞추고 있습니다.