Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Does Feasibility Matter? Understanding the Impact of Feasibility on Synthetic Training Data

Created by
  • Haebom

저자

Yiwen Liu, Jessica Bader, Jae Myung Kim

개요

본 논문은 합성 데이터로 훈련된 확산 모델이 현실에는 존재하지 않는 이미지(예: 공중에 떠 있는 개)를 생성하는 문제를 다룹니다. 연구진은 합성 이미지의 속성이 현실 세계에서 존재할 수 있는지를 나타내는 '실현 가능성(feasibility)' 개념을 정의하고, 실현 가능성이 낮은 이미지는 훈련 데이터에서 제외해야 한다는 기존의 생각에 의문을 제기합니다. CLIP 기반 분류기를 위한 합성 훈련 데이터 생성 시 배경, 색상, 질감 세 가지 속성에 대해 실현 가능성의 영향을 조사하기 위해, 텍스트 프롬프트를 기반으로 소스 이미지를 최소한으로 편집하여 실현 가능하거나 불가능한 속성을 포함하는 VariReal 파이프라인을 제시합니다. 실험 결과, 실현 가능성이 LoRA-fine-tuned CLIP 성능에 미치는 영향은 미미하며(대부분 상위 1% 정확도에서 0.3% 미만 차이), 속성에 따라 실현 가능/불가능 이미지가 분류 성능에 역으로 영향을 미치는 경우도 있습니다. 또한, 훈련 데이터에 실현 가능 및 불가능 이미지를 혼합하여 사용하는 것이 순수하게 실현 가능하거나 불가능한 데이터셋을 사용하는 것보다 성능에 큰 영향을 미치지 않는다는 것을 보여줍니다.

시사점, 한계점

시사점: CLIP 기반 분류기 훈련 시 합성 데이터의 실현 가능성이 성능에 미치는 영향이 미미함을 밝혔습니다. 따라서 실현 가능성에 대한 엄격한 제약 없이 합성 데이터를 활용할 수 있음을 시사합니다. 다양한 속성에 대한 실현 가능성의 영향을 분석하여, 데이터 생성 전략을 개선하는 데 도움을 줄 수 있습니다.
한계점: 실험은 세 가지 속성(배경, 색상, 질감)에 국한되어 있으며, 다른 속성이나 더 복잡한 시각적 개념에 대한 일반화 가능성은 추가 연구가 필요합니다. 사용된 데이터셋의 특성에 따라 결과가 달라질 수 있으므로, 다양한 데이터셋에 대한 추가 실험이 필요합니다. VariReal 파이프라인의 편집 방식이 최소한으로 제한되어 있으므로, 더욱 다양하고 복잡한 편집을 고려한 연구가 필요할 수 있습니다.
👍