大规模语言模型 (LLM) 的进步使得类人社交模拟能够达到前所未有的规模和保真度。然而,构建能够真实反映现实世界人口多样性和分布的人物角色集仍然是一项关键挑战。本文提出了一个系统框架,用于合成高质量、与人群对齐的人物角色集,用于基于 LLM 的社交模拟。该框架首先利用 LLM 从长期社交媒体数据中生成叙事人物角色集,并通过质量评估过滤掉低保真度的人物角色集。然后,应用重要性抽样法,实现与参考心理测量分布(例如“大五人格特质”)的全局对齐。为了满足特定模拟情境的需求,我们添加了特定任务的模块,将全局对齐的人物角色集应用于目标亚群。大量实验表明,我们的方法显著降低了人群层面的偏差,并能够实现准确灵活的社交模拟,并具有广泛的研究和政策应用价值。