CUBIC (Concept embeddings for Unsupervised Bias IdentifiCation)은 심층 시각 모델의 편향을 식별하기 위해 이미지-텍스트 잠재 공간과 선형 분류기 프로브를 활용하는 새로운 방법입니다. 기존 방법과 달리, 사전 정의된 편향 후보나 특정 편향과 관련된 모델 오류 예시에 의존하지 않고, 슈퍼클래스 레이블의 잠재 표현에 특정 개념이 미치는 영향을 분석하여 편향을 자동으로 발견합니다. 데이터셋의 모든 인스턴스가 공유하는 슈퍼클래스 레이블의 잠재 표현이 특정 개념의 존재에 따라 어떻게 변화하는지 측정하고, 이 변화를 분류기의 결정 경계에 대한 법선 벡터와 비교하여 모델 예측에 큰 영향을 미치는 개념을 식별합니다. Vision-Language Models (VLMs)을 사용하여 기존에 알려지지 않은 편향을 효과적으로 발견하며, 분류기 성능 저하 샘플이나 잠재적 편향에 대한 사전 지식 없이도 동작합니다.