Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Generative Annotation for ASR Named Entity Correction

Created by
  • Haebom

作者

Yuanchang Luo, Daimeng Wei, Shaojun Li, Hengchao Shang, Jiaxin Guo, Zongyao Li, Zhanglin Wu, Xiaoyu Chen, Zhiqiang Rao, Jinlong Yang, Hao Yang

概要

本稿では、エンドツーエンドの自動音声認識システムのドメイン固有の名前付きエンティティ転写エラーの問題を解決するために、音声音響機能を利用した新しい名前付きオブジェクト修正(NEC)方法を提案します。従来のphonetic-level edit distanceベースのNECモデルは、エラーワードと正解との間の形態差が大きい場合に性能が低下する限界を有するが、本論文の方法は音声音響特徴を利用して候補オブジェクトを検索し、生成モデルを通じてASR転写物のオブジェクトエラーを注釈し正解オブジェクトに置き換えることによってこの限界を克服する。オープンおよびセルフビルドテストセットを使用した実験の結果、提案された方法はオブジェクトの精度を大幅に向上させ、セルフビルドテストセットとトレーニングデータを公開する予定です。

Takeaways、Limitations

Takeaways:
音声音響特性を活用して既存方式の限界を克服する新しいNEC方式を提示
誤り語と正解の形の違いが大きい場合でも効果的な性能を示す
オブジェクト精度の向上に貢献
自己構築データセット公開による研究の再現性と拡張性の確保
Limitations:
提案された方法の一般化性能に関するさらなる研究の必要性
さまざまなドメインと言語のパフォーマンス評価が必要
自己構築データセットの規模と品質のレビューが必要
👍