Sign In

A Comprehensive Evaluation of Cognitive Biases in LLMs

Created by
  • Haebom
Category
Empty

저자

Simon Malberg, Roman Poletukhin, Carolin M. Schuster, Georg Groh

개요

본 논문은 다양한 의사 결정 시나리오에서 20개의 최첨단 대규모 언어 모델(LLM)에 대한 30가지 인지 편향에 대한 대규모 평가를 제시합니다. LLM 테스트를 위한 신뢰할 수 있고 대규모의 테스트 생성을 위한 새로운 범용 테스트 프레임워크, LLM에서 인지 편향을 감지하기 위한 30,000개의 테스트가 포함된 벤치마크 데이터 세트, 평가된 20개 LLM에서 발견된 편향에 대한 포괄적인 평가를 제공합니다. 또한, 이 연구는 20개 LLM 중 적어도 일부에서 테스트된 30가지 편향 모두에 대한 증거를 보고함으로써 LLM에서 인지 편향의 존재를 시사하는 이전 연구 결과를 확인하고 확장합니다. 연구에 사용된 프레임워크 코드는 https://github.com/simonmalberg/cognitive-biases-in-llms에서 공개되었습니다.

시사점, 한계점

20개의 LLM에서 30가지 인지 편향 모두를 확인.
LLM의 편향 연구를 위한 새로운 테스트 프레임워크와 벤치마크 데이터 세트 제공.
GitHub에 연구 프레임워크 코드 공개를 통해 후속 연구를 장려.
제공된 정보만으로는 연구의 구체적인 한계점을 알 수 없음.
👍