FaceID-6M: A Large-Scale, Open-Source FaceID Customization Dataset
Created by
Haebom
저자
Shuhe Wang, Xiaoya Li, Jiwei Li, Guoyin Wang, Xiaofei Sun, Bob Zhu, Han Qiu, Mo Yu, Shengjie Shen, Tianwei Zhang, Eduard Hovy
개요
본 논문은 얼굴 식별(FaceID) 맞춤화 모델 학습에 필요한 대규모 고품질 텍스트-이미지 데이터셋의 부재 문제를 해결하기 위해, 6백만 개의 고품질 텍스트-이미지 쌍을 포함하는 최초의 대규모 오픈소스 FaceID 데이터셋인 FaceID-6M을 제시합니다. LAION-5B 데이터셋에서 필터링 및 정제 과정을 거쳐 이미지 해상도, 얼굴 존재 여부, 사람 관련 키워드 포함 여부 등을 기준으로 엄격한 품질 관리를 수행했습니다. FaceID-6M을 이용하여 학습된 모델은 기존 상용 모델과 비슷하거나 약간 더 나은 성능을 보이며, 코드, 데이터셋, 모델 모두 공개하여 연구 발전에 기여합니다.
시사점, 한계점
•
시사점:
◦
최초의 대규모 오픈소스 FaceID 데이터셋 제공을 통한 연구개발 활성화
◦
기존 상용 모델에 필적하는 성능을 달성하는 모델 학습 가능성 제시
◦
데이터셋, 코드, 모델의 공개를 통한 연구 투명성 및 재현성 향상
•
한계점:
◦
LAION-5B 데이터셋을 기반으로 하므로, 원본 데이터셋의 편향성이 FaceID-6M에도 영향을 미칠 가능성 존재
◦
데이터셋의 품질 관리 과정에서 발생할 수 있는 오류 및 누락에 대한 추가적인 검증 필요
◦
데이터셋의 규모가 크더라도, 특정 인종이나 성별에 대한 데이터 불균형 문제가 존재할 가능성 존재