每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

利用在线数据增强小型波斯语语言模型中的医学知识

Created by
  • Haebom

作者

迈赫达德·加萨比、佩德拉姆·罗斯塔米、哈米德雷扎·巴拉达兰·卡沙尼、阿米尔侯赛因·普尔西纳、扎赫拉·卡泽米、米拉德·塔瓦科利

大纲

为了克服小型语言模型在波斯语等资源匮乏的专业领域中的局限性,本研究引入了一个全新的数据集,该数据集包含 2 万对医患问答,以及一个从医学期刊爬取的 9000 万个词条语料库。我们利用该数据集,通过参数高效的微调,提升了基线模型 aya-expanse-8b 的医学知识。

Takeaways, Limitations

展示小型语言模型对波斯语医学领域的适用性。
使用开放获取的在线数据在资源受限的环境中提供医疗 AI 解决方案。
微调模型提高了医学问答的准确性并通过了IBSEE。
翻译成波斯语时,MMLU 的准确率平均提高了 2.67%。
未来的研究可以探索通过多模式输入来提高性能。
👍