Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Bias or Optimality? Disentangling Bayesian Inference and Learning Biases in Human Decision-Making

Created by
  • Haebom

저자

Prakhar Godara

개요

본 논문은 두 팔 베르누이 밴딧(TABB) 과제에서 인간 행동이 긍정적 편향과 확인 편향으로 설명된다는 기존 연구에 대해 재검토한다. 연구진은 주관적인 베이즈 추론을 통해 에이전트가 신념을 업데이트하더라도, 비대칭 학습률을 가진 표준 Q-러닝 모델을 적용하면 여전히 두 가지 편향이 나타난다는 것을 발견했다. 베이즈 추론을 효과적인 Q-러닝 알고리즘으로 해석하면, 학습률은 감소하지만 대칭적이다. 마스터 방정식을 이용한 확률적 동역학 분석을 통해 확인 편향과 편향되지 않은 감소하는 학습률이 동일한 행동적 특징을 생성함을 보였다. 마지막으로, 감소하는 학습률의 인공물과 진정한 인지적 편향을 구분하기 위한 실험적 프로토콜을 제안한다.

시사점, 한계점

시사점: TABB 과제에서 관찰되는 긍정적 편향과 확인 편향이 반드시 인지적 편향 때문만은 아니라는 것을 시사한다. 감소하는 학습률이 이러한 행동적 특징을 생성할 수 있음을 보여줌으로써, 인지 과정에 대한 이해를 심화시킨다. 진정한 인지적 편향과 학습률 효과를 구분할 수 있는 새로운 실험 설계를 제시한다.
한계점: 제안된 실험적 프로토콜의 실제 효용성은 추가적인 실험을 통해 검증되어야 한다. 현재 모델은 단순화된 TABB 과제에 국한되며, 더 복잡한 의사결정 과제로 일반화 가능성을 추가적으로 연구해야 한다. 인지적 편향과 학습률 효과를 완벽하게 구분하는 것이 실험적으로 어려울 수 있다.
👍