识别学生反思中的文化资本 (CC) 主题可以提供宝贵的见解,有助于营造公平的学习环境。然而,诸如志向、目标和家庭支持等主题往往交织在叙述中,而非作为直接的关键词出现。这使得它们难以被标准 NLP 模型检测到,因为这些模型会单独处理句子。一个关键挑战在于,标准模型是在通用语料库上进行预训练的,无法识别数据中固有的领域特定语言和叙述语境。为了解决这个问题,我们引入了 AWARE 框架,该系统可以系统地提升 Transformer 模型对这一复杂任务的理解。AWARE 包含三个核心组件:1)领域感知(根据学生反思的语言风格调整模型词汇),2)语境感知(生成能够识别文章整体语境的句子向量),以及 3)类别重叠感知(使用多标签策略识别单个句子中主题的共存)。因此,AWARE 在宏 F1 上的表现比强基线高出 2.1 个百分点,并通过明确识别输入的属性在所有主题上均表现出显著的提升。这项研究为任何文本分类任务(其中含义取决于叙述的上下文)提供了一种稳健且可推广的方法。