본 논문은 대규모 언어 모델(LLM)의 특성을 평가하기 위한 심리 측정 설문 조사가 증가함에 따라, LLM에 적합한 확장 가능한 설문 항목 생성이 필요하다는 점을 강조합니다. 특히, 생성된 항목이 의도한 특성을 실제로 측정하는지 확인하는 구성 타당성 확보가 중요합니다. 기존에는 대규모의 비용이 많이 드는 인간 데이터 수집이 필요했으나, 본 연구에서는 LLM을 활용한 가상 응답자 시뮬레이션 프레임워크를 제시합니다. 이 프레임워크는 매개 변수를 고려하여, 동일한 특성이 설문 항목에 대한 다양한 응답을 발생시키는 요인을 처리합니다. 다양한 매개 변수를 가진 응답자를 시뮬레이션하여 의도한 특성을 효과적으로 측정하는 설문 항목을 식별합니다. Big5, Schwartz, VIA의 세 가지 심리적 특성 이론에 대한 실험 결과, 제안된 매개 변수 생성 방법과 시뮬레이션 프레임워크가 높은 타당성을 가진 항목을 효과적으로 식별한다는 것을 입증했습니다. LLM은 특성 정의로부터 그럴듯한 매개 변수를 생성하고 항목 타당성을 위해 응답자 행동을 시뮬레이션하는 능력을 보여주었습니다. 본 연구의 문제 공식화, 지표, 방법론 및 데이터 세트는 비용 효율적인 설문 개발과 LLM의 인간 설문 응답 시뮬레이션에 대한 더 깊은 이해를 위한 새로운 방향을 제시합니다.