대규모 언어 모델(LLM)의 발전을 통해 전례 없는 규모와 충실도로 인간과 유사한 사회 시뮬레이션이 가능해졌지만, 실제 세계 인구의 다양성과 분포를 진정성 있게 나타내는 페르소나 세트를 구성하는 것이 중요한 과제입니다. 본 논문에서는 LLM 기반 사회 시뮬레이션을 위한 고품질, 인구 정렬 페르소나 세트를 합성하는 체계적인 프레임워크를 제안합니다. 이 프레임워크는 LLM을 활용하여 장기 소셜 미디어 데이터로부터 내러티브 페르소나를 생성하고, 품질 평가를 통해 낮은 충실도의 프로필을 걸러내는 것으로 시작합니다. 그 후, Big Five 성격 특성과 같은 참조 심리 측정 분포에 대한 전반적인 정렬을 달성하기 위해 중요도 샘플링을 적용합니다. 특정 시뮬레이션 컨텍스트의 요구 사항을 해결하기 위해, 전반적으로 정렬된 페르소나 세트를 타겟 하위 인구 집단에 적용하는 작업별 모듈을 추가합니다. 광범위한 실험을 통해 본 연구 방법론이 인구 수준의 편향을 유의미하게 줄이고, 광범위한 연구 및 정책 적용 분야에서 정확하고 유연한 사회 시뮬레이션을 가능하게 함을 보여줍니다.
시사점, 한계점
•
시사점:
◦
LLM 기반 사회 시뮬레이션을 위한 고품질, 인구 정렬 페르소나 세트 합성 프레임워크 제시