Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Mutarjim: Advancing Bidirectional Arabic-English Translation with a Small Language Model

Created by
  • Haebom

作者

Khalil Hennara, Muhammad Hreden, Mohamed Motaism Hamed, Zeina Aldallal, Sara Chrouf, Safwan AlModhayan

概要

Mutarjimは、アラビア語から英語への双方向翻訳のためのコンパクトで強力な言語モデルです。 Kuwain-1.5Bに基づいており、大規模な言語モデルよりもはるかに小さいですが、最適化された2段階学習方法と厳選された高品質学習データセットを使用して、複数の基準ベンチマークでより大きなモデルを上回るパフォーマンスを実証します。また、既存のアラビア語 - 英語のベンチマークデータセットの限界(狭いドメイン、短い文章の長さ、英語のソースバイアス)を克服するために、5,000の専門家レビュー文のペアで構成される新しいベンチマークTarjama-25も提示します。 Mutarjimは、Tarjama-25の英語-アラビア語翻訳課題で最先端のパフォーマンスを達成し、GPT-4o miniなどの大規模な独占モデルを上回ります。 Tarjama-25データセットは公に配布されています。

Takeaways、Limitations

Takeaways:
小規模言語モデルが大規模モデルと比較して競争力のある翻訳パフォーマンスを達成できることを示しています。
計算コストと学習要件を大幅に削減します。
既存のアラビア語 - 英語翻訳評価データセットの限界を克服する新しいベンチマークTarjama-25を提示します。
Tarjama-25データセットの公開によるアラビア語 - 英語翻訳研究の発展に貢献
Limitations:
Mutarjimモデルの具体的なLimitationsや性能低下のケースへの言及が不足しています。
Tarjama-25データセットの規模は、他の大規模ベンチマークと比較して比較的小さい場合があります。 (5,000文のペアは比較的少ないデータ量です)
Kuwain-1.5Bモデルの詳細な説明が不足しています。
👍