본 논문은 Big Five 성격 특성 프레임워크를 사용하여 인공지능 에이전트(AI-Agents)에 정량화 가능하고 심리 측정적으로 검증된 성격을 부여하는 방법론을 제시하고, 그 타당성과 한계를 평가한다. 세 개의 연구를 통해 대규모 언어 모델(LLMs)이 Big Five 척도 간의 의미적 유사성을 포착하여 성격 할당의 기반을 제공함을 보였다. 또한, Big Five Inventory-2 (BFI-2)를 기반으로 설계된 프롬프트를 사용하여 생성된 AI-Agents가 인간의 반응과 유사한 경향을 보였지만, 세부적인 결과 패턴에는 일관성이 부족했다. 마지막으로, 위험 감수 및 도덕적 딜레마 시나리오에서 BFI-2-Expanded 형식으로 프롬프트된 모델이 인간의 성격-결정 간의 연관성을 가장 가깝게 재현하는 것을 확인했다.