每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

构建资源受限的语言代理:韩国化学毒性信息案例研究

Created by
  • Haebom

作者

Hojun Cho、Donghu Kim、Soyoung Yang、Chan Lee、Hunjoo Lee、Jaegul Choo

大纲

本文介绍了韩国化学毒性信息代理 Tox-chat,旨在解决基于大规模语言模型 (LLM) 的语言代理在资源受限的环境中(尤其是在专业化和稀疏语言中)面临的部署挑战。该代理采用上下文高效的架构,通过分层分段搜索减少 token 消耗,并采用基于场景的对话生成方法,有效地从大型模型中提取工具使用技能。实验结果表明,经过微调的 80 亿参数模型在数据库保真度和偏好方面显著优于未微调的模型和基线方法。

Takeaways, Limitations

Takeaways:
提出了在资源受限的环境中开发特定领域语言代理的可能性。
通过分层部分搜索和基于场景的对话生成增强令牌使用和工具利用率。
经过微调的紧凑模型(8B)显示出显著的性能提升。
提供在实际约束下开发特定领域语言代理的见解。
Limitations:
论文内容中缺少关于具体 Limitations 的内容(摘要中未提及具体 Limitations 的内容)
(推论)仅限于特定的化学毒性信息领域
(推论)8B 模型的性能限制需要在未来通过与更大模型的比较来验证。
👍