随着政治辩论及相关讨论的兴起,人们迫切需要自动化分析方法来帮助公民进行政治思考。政治语言的特殊性及其论证的论证性质(利用隐藏的沟通策略和隐含的断言),使得即使对于现有的通用预训练语言模型而言,这项任务也充满挑战。为了应对这一挑战,我们提出了 RooseBERT,这是一个专门针对政治话语语言的预训练语言模型。RooseBERT 基于大量英语政治辩论和演讲语料库(8,000 场辩论,每场辩论包含多个关于不同主题的子辩论)进行训练。为了评估 RooseBERT 的性能,我们针对四个与政治辩论分析相关的子任务对其进行了微调:立场检测、情感分析、主张要素检测与分类以及主张关系预测与分类。结果显示,在所有四个任务中,RooseBERT 的性能均显著优于通用语言模型,这表明针对特定领域的预训练可以提升政治辩论分析的性能。RooseBERT 已面向研究社区发布。