每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

从黑盒二元分类器中提取 PAC 决策树:基于 BERT 的语言模型的性别偏见案例研究

Created by
  • Haebom

作者

尾崎安娜、罗伯托·孔法洛尼耶里、里卡多·吉马尔·埃斯、安德斯·伊梅内斯

大纲

本文探讨了决策树在可解释人工智能中的应用,以及如何确保其在逼近复杂黑盒人工智能模型行为时的准确性。具体而言,我们使用“可能近似正确”(PAC)框架,为提取的决策树的保真度提供理论保证。我们针对二分类问题,进行了从基于 BERT 的语言模型中提取决策树并应用 PAC 保证的实验。

Takeaways, Limitations

我们利用 PAC 框架为解释黑盒 AI 模型行为的决策树的准确性提供理论保证。
我们通过基于 BERT 的语言模型提取的决策树发现了职业性别偏见。
该研究仅限于二元分类问题,需要进一步研究探索将其扩展到其他分类或回归问题的可能性。
PAC保障存在一定的条件约束(如数据分布),实际应用中需要努力满足这些条件。
👍