Sign In

Digital Divides in Scene Recognition: Uncovering Socioeconomic Biases in Deep Learning Systems

Created by
  • Haebom
Category
Empty

저자

Michelle R. Greene, Mariam Josyula, Wentao Si, Jennifer A. Hart

개요

본 논문은 심층 합성곱 신경망(dCNN)을 이용한 장면 분류에서의 사회경제적 편향을 조사한 연구입니다. 전 세계 및 미국 출처의 약 백만 장에 달하는 이미지(사용자가 제출한 가정 사진 및 Airbnb 목록 포함)를 사용하여 가계 소득, 인간 개발 지수(HDI), 인구 통계적 요소 등의 사회경제적 지표가 dCNN 성능에 미치는 영향을 정량적으로 분석했습니다. 그 결과, 사전 훈련된 dCNN은 사회경제적 지위(SES)가 낮은 가정의 이미지에서 특히 분류 정확도와 신뢰도가 낮고, "폐허", "빈민가"와 같이 공격적으로 해석될 수 있는 레이블을 할당하는 경향이 더 높은 것으로 나타났습니다. 이러한 경향은 두 개의 국제 이미지 데이터셋과 미국의 다양한 경제적, 인종적 환경에서 일관되게 나타났습니다. 이 연구는 컴퓨터 비전의 편향을 이해하고, 더 포괄적이고 대표적인 훈련 데이터셋의 필요성을 강조합니다.

시사점, 한계점

시사점:
컴퓨터 비전 시스템의 사회경제적 편향을 밝혀냄으로써, 주택 평가 및 스마트 홈 보안 시스템 등 응용 컴퓨터 비전 분야에서 더 공정하고 공평한 결과를 보장하기 위해 편향을 완화해야 할 필요성을 강조합니다.
도시 개발 및 자원 배분과 같은 중요한 의사 결정에 상당한 영향을 미칠 수 있는 편향을 해결해야 할 긴급성을 제시합니다.
다양한 사회 집단을 더 잘 이해하고 섬기는 AI 시스템 개발을 촉진하여 모든 사회 계층에 공평하게 혜택을 주는 기술로 나아가야 함을 시사합니다.
한계점:
본 연구는 사용된 데이터셋의 특성과 한계로 인해 일반화 가능성에 대한 제한이 있을 수 있습니다.
다양한 사회경제적 요인 외 다른 요인(예: 이미지 품질, 사진 촬영 방식 등)의 영향을 명확하게 구분하지 못했습니다.
편향 완화를 위한 구체적인 기술적 해결책을 제시하지 못했습니다.
👍