본 논문은 균형 잡힌 훈련 데이터에도 불구하고 심층 신경망(DNN)이 객체 인식 과정에서 특정 범주에 대해 편향을 나타내는 현상에 대해 다룹니다. 인간의 시각 시스템이 계층적 처리를 통해 객체 다양체를 분리하여 객체 인식을 수행하는 방식에서 영감을 얻어, DNN에서 클래스별 지각 다양체의 기하학적 복잡성을 모델 편향과 연결하는 기하학적 분석 프레임워크를 제안합니다. 연구 결과, 기하학적 복잡성의 차이가 범주 간 인식 능력의 차이를 야기하고 편향을 유발함을 밝힙니다. 이 분석을 뒷받침하기 위해 지각 다양체의 기하학적 특성을 계산하도록 설계된 Perceptual-Manifold-Geometry 라이브러리를 제시합니다.
시사점, 한계점
•
시사점: DNN의 객체 인식 편향에 대한 새로운 이해를 제공하며, 기하학적 복잡성이 편향의 주요 원인임을 제시합니다. Perceptual-Manifold-Geometry 라이브러리를 통해 DNN의 지각 다양체 분석을 용이하게 합니다. 향후 DNN의 편향 완화 및 성능 향상 연구에 기여할 수 있습니다.
•
한계점: 제안된 프레임워크가 모든 유형의 DNN 편향을 설명할 수 있는지에 대한 추가 연구가 필요합니다. Perceptual-Manifold-Geometry 라이브러리의 적용 범위 및 계산 효율성에 대한 추가적인 검증이 필요합니다. 인간 시각 시스템과 DNN 간의 유추에 대한 한계를 명확히 할 필요가 있습니다.