[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Mitigating Stylistic Biases of Machine Translation Systems via Monolingual Corpora Only

Created by
  • Haebom

作者

Xuanqi Gao, Weipeng Jiang, Juan Zhai, Shiqing Ma, Siyi Xie, Xinyang Yin, Chao Shen

概要

この論文では、ニューラルネットワーク機械翻訳(NMT)でスタイルの維持を改善するための新しいフレームワークであるBabelを紹介します。従来のスタイル保持アプローチが並列の束を必要とするのとは異なり、Babelは単一の言語の束だけを使用します。 Babelは、コンテキスト埋め込みに基づいてスタイルの不整合を識別するスタイル検出器と、意味的な整合性を維持しながらスタイルの不一致を修正する拡散ベースのスタイルアプライヤの2つの主要コンポーネントで構成されています。既存のNMTシステムに後処理モジュールとして統合され、アーキテクチャ変更や並列スタイルデータなしでスタイル認識翻訳を可能にします。 5つの異なる分野(法律、文学、科学論文、医学、教育コンテンツ)の広範な実験の結果、Babelは88.21%の精度でスタイルの不一致を識別し、スタイルの維持を150%向上させると同時に0.92の高い意味的類似性スコアを維持することが示されています。人による評価も、Babelへの改善された翻訳が流暢さと適切性を維持しながら、元のテキストスタイルをよりよく保存することを確認しました。

Takeaways、Limitations

Takeaways:
単一言語の束だけを使用してNMTでスタイルを維持するための新しい方法の提示
既存のNMTシステムの後処理モジュールに簡単に統合できます。
様々な分野におけるスタイルの維持と意味的類似性の向上を実験的に検証した。
人の評価を通じて翻訳品質の向上を確認。
Limitations:
この論文では、特定の単一言語の言葉の種類やサイズの詳細な説明が不足しています。様々な群れの一般化の可能性に関するさらなる研究が必要である。
後処理モジュールとしてのアプローチのために、NMTモデル自体のスタイル学習能力の改善は限定的であり得る。
5つの分野の実験結果のみが提示されたので、他の分野への一般化の可能性に関するさらなる研究が必要です。
👍