每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

通过综合语义洞察训练来提升文本到图表的检索能力

Created by
  • Haebom

作者

吴一凡、严陆涛、朱一章、梅一男、王建南、唐南、罗玉宇

大纲

本文探讨了如何开发一个文本转图表检索系统,该系统能够识别符合用户分析需求的相关图表,并锁定对数据分析和决策至关重要的图表。为了克服现有系统的局限性,我们提出了一个训练数据开发流程,可以自动合成涵盖视觉模式、统计属性和实际应用的分层语义信息。基于此流程,我们训练了基于 CLIP 的模型 ChartFinder,使其学习能够更好地理解图表视觉和语义特征的表征。此外,我们构建了一个基准测试 CRBench,并使用来自实际商业智能 (BI) 应用程序的图表和文本查询来评估文本转图表检索的性能。实验结果表明,ChartFinder 在精确查询和模糊查询方面均显著优于现有方法。

Takeaways,Limitations

Takeaways:
通过考虑图表的视觉和语义特征,文本到图表的搜索性能得到了提高。
我们通过开发自动生成分层语义信息的训练数据管道来解决数据短缺问题。
我们根据实际BI环境中收集的数据构建了基准CRBench,以增加性能评估的可靠性。
它在精确查询和模糊查询方面都比现有模型取得了更好的性能。
Limitations:
论文中没有具体提及Limitations。
👍