每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

纯探索的情境学习

Created by
  • Haebom

作者

阿莱西奥·罗素、瑞安·韦尔奇、阿尔多·帕基亚诺

大纲

本文研究了主动序列假设检验 (AST) 问题,其中学习器自适应地从环境中收集数据,以有效地为新任务确定一个基本正确的假设。我们展示了多损失老虎机问题和广义搜索问题中最佳臂识别 (BAI) 任务的示例。我们引入了上下文纯探索 (ICPE),它对 Transformer 进行元训练,将观察历史映射到查询行为和预测假设。ICPE 主动收集新任务的证据,并在推理时无需更新参数即可推断出真实假设。在确定性、概率性和结构化基准测试(包括 BAI 和广义搜索)上,ICPE 的表现优于自适应基准测试,而无需明确建模信息结构。

Takeaways, Limitations

利用 Transformer 的 ICPE 模型被提出作为纯搜索问题的实用架构。
它在 BAI 和广义搜索等各种基准上展示了具有自适应基线的竞争性能。
无需明确建模信息结构即可解决问题的优势。
展示模型的泛化能力和对新任务的适应能力。
我们为基于 Transformer 的模型提供了一种高效的元学习和推理过程。
该论文的具体 Limitations 没有提及(但摘要中也没有说明)。
👍