Pay What LLM Wants: Can LLM Simulate Economics Experiment with 522 Real-human Persona?
Created by
Haebom
저자
Junhyuk Choi, Hyeonchu Park, Haemin Lee, Hyebeen Shin, Hyun Joung Jin, Bugeun Kim
개요
본 논문은 대규모 언어 모델(LLM)이 실제 인간의 경제적 의사결정을 얼마나 정확하게 예측할 수 있는지 평가한 연구입니다. 522명의 한국 참가자를 대상으로 한 Pay-What-You-Want(PWYW) 가격 책정 실험 데이터를 사용하여 세 가지 최첨단 다중 모드 LLM을 비교 분석했습니다. 참가자의 상세한 인적 정보를 활용하여 LLM이 개인의 선택을 정확하게 예측할 수 있는지, 그리고 인물 정보 주입 방식이 예측 성능에 어떤 영향을 미치는지 조사했습니다.
시사점, 한계점
•
시사점:
◦
실제 인간 데이터를 사용하여 LLM의 경제적 행동 시뮬레이션 능력에 대한 첫 번째 종합적인 평가를 제공합니다.
◦
LLM이 개별 수준의 예측에는 어려움을 겪지만, 집단 수준의 행동 경향은 상당히 잘 반영함을 보여줍니다.
◦
일반적으로 사용되는 프롬프팅 기법(개인적 이야기 재구성, 검색 증강 생성)이 단순한 프롬프팅 방법보다 유의미하게 성능이 향상되지 않음을 발견했습니다.