FaceID-6M: A Large-Scale, Open-Source FaceID Customization Dataset
Created by
Haebom
Category
Empty
저자
Shuhe Wang, Xiaoya Li, Jiwei Li, Guoyin Wang, Xiaofei Sun, Bob Zhu, Han Qiu, Mo Yu, Shengjie Shen, Eduard Hovy
개요
본 논문은 얼굴 식별(FaceID) 맞춤화 모델 학습에 필요한 대규모 고품질 텍스트-이미지 데이터셋의 부재 문제를 해결하기 위해, 6백만 개의 고품질 텍스트-이미지 쌍을 포함하는 최초의 대규모 오픈소스 FaceID 데이터셋인 FaceID-6M을 제시합니다. LAION-5B 데이터셋을 필터링하여 이미지 해상도, 얼굴 존재 여부, 텍스트 키워드 등을 기준으로 엄격한 정제 과정을 거쳤으며, FaceID-6M을 이용하여 학습된 모델은 기존 상용 모델과 비슷하거나 약간 더 나은 성능을 보임을 실험적으로 입증합니다. 데이터셋, 코드, 그리고 학습된 모델을 모두 공개하여 FaceID 맞춤화 연구 발전에 기여합니다.
시사점, 한계점
•
시사점:
◦
최초의 대규모 오픈소스 FaceID 데이터셋 제공으로 FaceID 맞춤화 연구의 투명성 증대 및 발전 촉진.
◦
고품질 데이터셋을 통해 기존 상용 모델에 필적하는, 혹은 그 이상의 성능을 달성하는 모델 학습 가능성 제시.
◦
공개된 코드, 데이터셋, 모델을 통한 연구 공동체의 활성화 및 협업 증진.
•
한계점:
◦
LAION-5B 데이터셋을 기반으로 하므로, 원본 데이터셋의 편향성이 FaceID-6M에도 일부 존재할 가능성.
◦
데이터셋의 규모가 크더라도, 다양한 인종, 연령, 성별 등의 다양성이 충분히 고려되었는지에 대한 추가적인 분석 필요.