본 논문은 대규모 언어 모델(LLM)의 성격을 분석하기 위한 새로운 벤치마크인 TRAIT를 제시합니다. TRAIT는 Big Five Inventory (BFI)와 Short Dark Triad (SD-3) 두 가지 심리 측정 검사를 기반으로 ATOMIC-10X 지식 그래프를 활용하여 8,000개의 다중 선택 질문으로 구성됩니다. 기존 LLM 성격 검사보다 신뢰성 및 타당성이 높으며, 내용 타당성, 내적 타당성, 거부율, 신뢰성 네 가지 측면에서 최고 점수를 달성했습니다. TRAIT를 사용한 실험 결과, LLM은 훈련 데이터의 영향을 크게 받는 독특하고 일관된 성격을 나타내며, 현재 프롬프팅 기법은 특정 성격 특성(예: 높은 반사회성 또는 낮은 성실성)을 유도하는 데 효과적이지 않다는 것을 밝혔습니다.