Sign In

Understanding Endogenous Data Drift in Adaptive Models with Recourse-Seeking Users

Created by
  • Haebom
Category
Empty

저자

Bo-Yi Liu, Zhi-Xuan Liu, Kuan Lun Chen, Shih-Yu Tsai, Jie Gao, Hao-Tsung Yang

개요

딥러닝 모델은 의사 결정 및 추천 시스템에 널리 사용되지만, 훈련과 배포 간의 정적 데이터 분포 가정을 따른다. 그러나 실제 배포 환경에서는 이러한 가정이 위반될 수 있다. 부정적인 결과를 얻은 사용자는 모델 기준을 충족하기 위해 특징을 조정하는 경향이 있으며, 이러한 적응 행동은 데이터 분포를 변화시킨다. 이러한 변화된 데이터를 기반으로 모델을 재훈련하면, 사용자 행동이 모델에 영향을 미치고, 업데이트된 모델이 다시 사용자 행동을 형성하는 피드백 루프가 발생한다. 본 연구에서는 사용자 전략적 행동과 자원 제약 및 경쟁 역학 하에서 의사 결정 시스템과의 상호 작용을 모델링하는 일반적인 프레임워크를 개발했다. 이론적 및 경험적 분석을 통해 사용자 소생 행동이 로지스틱 및 MLP 모델을 점점 더 높은 결정 기준으로 밀어, 시간이 지남에 따라 소생 비용이 증가하고 소생 조치의 신뢰성이 낮아지는 경향을 보임을 확인했다. 이러한 문제를 완화하기 위해 Fair-top-k 및 DCL (Dynamic Continual Learning)의 두 가지 방법을 제안하여 소생 비용을 크게 줄이고 모델의 견고성을 향상시켰다. 본 연구 결과는 알고리즘 의사 결정이 의도치 않게 더 높은 기준을 강화하고 내생적 진입 장벽을 생성할 수 있음을 강조하며, 경제 이론과의 연결성을 보여준다.

시사점, 한계점

사용자 소생 행동과 모델의 상호 작용으로 인한 데이터 분포 변화의 중요성을 강조하고, 이를 모델링하는 프레임워크 제시
로지스틱 및 MLP 모델이 사용자 소생 행동으로 인해 점점 더 높은 결정 기준을 가지게 됨을 밝힘
Fair-top-k 및 DCL 제안을 통해 소생 비용 감소 및 모델 견고성 향상
알고리즘 의사 결정이 경제적 불평등을 심화시킬 수 있음을 시사
연구 결과가 특정 모델 아키텍처 (로지스틱, MLP)에 초점을 맞추고 있으며, 다른 모델 아키텍처에 대한 일반화 가능성은 추가 연구 필요
실제 환경에서의 데이터 변화를 완벽하게 포착하기 어려울 수 있으며, 모델과 사용자 간의 복잡한 상호 작용을 모두 반영하지 못할 수 있음
👍