Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Science Across Languages: Assessing LLM Multilingual Translation of Scientific Papers

Created by
  • Haebom

作者

Hannah Calzi Kleidermacher, James Zou

概要

本論文は、ほとんどの学術誌が英語でのみ出版され、非英語圏の研究者に障壁となる現実に注目し、大規模言語モデル(LLM)を活用した学術論文自動翻訳システムを提示する。 JATS XML形式を維持しながら様々な科学分野の論文を28言語に翻訳し、独創的な質疑応答(QA)ベースの評価方法により翻訳精度(平均95.9%)を測定した。 15人の研究者を対象としたユーザー研究では翻訳の正確性を確認し、一部の技術用語の過度な翻訳に対する好みの違いも発見した。また、インコンテキスト学習技術を活用して過度の翻訳問題を軽減するなど、LLMベースの翻訳の適応性と有用性を示しています。ソースコードと翻訳された論文はhttps://hankleid.github.io/ProjectMundoで確認できます。

Takeaways、Limitations

Takeaways:
LLMを活用した学術論文自動翻訳システムの実現可能性を提示
JATS XML形式の保持による実際の学術誌の適用性の向上
質疑応答に基づく評価法による翻訳精度の客観的評価
多様な言語(28ヶ国語)のサポートを通じて幅広いアクセシビリティを確保。
In-context learningによる翻訳品質の向上とユーザーカスタマイズの可能性の提示
Limitations:
いくつかの技術用語に対する過度の翻訳問題の発生とユーザーの好みに応じた追加の調整の必要性
ユーザーの研究規模が比較的小さい(15人)。
特定の分野に偏りがあるかどうかの追加の研究が必要です。
LLMの性能に依存するシステム構造
👍