每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

AWARE,超越句子界限:用于识别 STEM 叙事中文化资本的语境转换框架

Created by
  • Haebom

作者

哈立德·梅赫塔布·汗、Anagha Kulkarni

大纲

识别学生反思中的文化资本 (CC) 主题可以提供宝贵的见解,有助于营造公平的学习环境。然而,诸如志向、目标和家庭支持等主题往往交织在叙述中,而非作为直接的关键词出现。这使得它们难以被标准 NLP 模型检测到,因为这些模型会单独处理句子。一个关键挑战在于,标准模型是在通用语料库上进行预训练的,无法识别数据中固有的领域特定语言和叙述语境。为了解决这个问题,我们引入了 AWARE 框架,该系统可以系统地提升 Transformer 模型对这一复杂任务的理解。AWARE 包含三个核心组件:1)领域感知(根据学生反思的语言风格调整模型词汇),2)语境感知(生成能够识别文章整体语境的句子向量),以及 3)类别重叠感知(使用多标签策略识别单个句子中主题的共存)。因此,AWARE 在宏 F1 上的表现比强基线高出 2.1 个百分点,并通过明确识别输入的属性在所有主题上均表现出显著的提升。这项研究为任何文本分类任务(其中含义取决于叙述的上下文)提供了一种稳健且可推广的方法。

Takeaways, Limitations

Takeaways:
提出一个新框架 AWARE,用于识别学生反思中的文化资本主题。
通过识别域、上下文和类重叠来提高标准 NLP 模型的性能。
为文本分类任务提供一种可推广的方法,其中含义取决于上下文。
Limitations:
缺乏有关特定模型结构或数据集的详细信息。
需要进一步的实验来确定 AWARE 的普遍性。
需要检查对特定文化资本主题的偏见的可能性。
👍