本文强调,随着用于评估大规模语言模型 (LLM) 特征的心理测量调查日益增多,开发适用于 LLM 的可扩展问卷生成系统至关重要。尤其需要确保构建效度,即验证生成的问卷是否真正衡量了预期特征。虽然传统上需要大规模且成本高昂的人工数据收集,但本研究提出了一个使用 LLM 模拟虚拟受访者的框架。该框架考虑了参数,以解释导致对具有相同特征的调查问卷产生不同反应的因素。通过模拟具有不同参数的受访者,该框架可以识别出能够有效衡量预期特征的问卷问卷。基于三种心理特质理论(Big5、Schwartz 和 VIA)的实验结果表明,所提出的参数生成方法和模拟框架能够有效识别具有高效度的问卷。LLM 能够根据特征定义生成合理的参数,并模拟受访者行为以验证问卷的效度。本研究的问题表述、指标、方法和数据集为经济高效的问卷开发以及更深入地理解 LLM 中的人工调查响应模拟指明了新的方向。