每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

解锁法律知识:瑞士司法摘要的多语言数据集

Created by
  • Haebom

作者

卢卡·罗尔斯霍文、Vishvaksenan Rasiah、Srinanda Brugger Bose、Sarah Hostettler、Lara Burkhalter、Matthias St urmer、Joel Niklaus

大纲

本文介绍了瑞士地标判决摘要 (SLDS) 数据集,该数据集包含瑞士联邦法院的 20,000 份判决书。每份判决书均包含德语、法语和意大利语的判例摘要(摘要)。研究人员对 Qwen2.5、Llama 3.2 和 Phi-3.5 等开源模型进行了微调,并将其性能与 GPT-4o、Claude 3.5 Sonnet 和 DeepSeek R1 等大规模模型进行了比较。虽然使用 LLM-as-a-Judge 框架的微调模型在词汇相似性方面表现更佳,但大规模模型能够生成更准确、更一致的法律摘要。有趣的是,专注于推理的模型并未始终表现出优势,这表明在这项任务中,事实准确性比深度推理更为重要。SLDS 数据集采用 CC BY 4.0 许可发布,旨在支持未来多语言法律摘要领域的研究。

Takeaways, Limitations

Takeaways:
SLDS 数据集正在公开,以促进提高瑞士法律信息的可访问性和创新法律研究。
通过对多语言法律摘要模型性能的比较分析,提出最佳模型和方法。
事实上,这表明在法律简易程序中准确性比推理能力更重要。
Limitations:
本研究仅限于特定国家(瑞士)的法律体系。
所使用的 LLM 的性能取决于模型的大小和类型,并且泛化可能受到限制。
除了词汇相似性和法律准确性之外,还需要考虑其他评估指标。
👍