Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

TISDiSS: A Training-Time and Inference-Time Scalable Framework for Discriminative Source Separation

Created by
  • Haebom

作者

Yongsheng Feng, Yuetonghui Xu, Jiehui Luo, Hongjia Liu, Xiaobing Li, Feng Yu, Wei Li

概要

本論文は、音声、音楽、およびオーディオ処理における基本的な課題であるソース分離を扱います。具体的には、トレーニングと展開のコストを増加させる大規模なネットワーク依存性の問題を解決するために、トレーニング時間と推論時間の拡張可能な識別ソース分離(TISDiSS)フレームワークを提案します。 TISDiSSは、早期スプリット多重スーパービジョン、シェアパラメータ設計、動的干渉 repetitionを統合し、追加のモデルの再訓練なしで推論深さを調整することで、柔軟なスピードパフォーマンストレードオフを可能にします。提案された方法は低遅延用途に有用であり、標準音声分離ベンチマークにおけるパラメータ数を減らしながら最高の性能を達成する。

Takeaways、Limitations

TISDiSSは、推論時間調整を通じて柔軟な速度 - 性能トレードオフを提供します。
トレーニング中により多くの推論反復を使用すると、浅い推論性能が向上し、低遅延アプリケーションに有利です。
提案されたフレームワークは、パラメータ数を減らしながら最先端の性能を達成します。
本論文のLimitationsは特に言及されていない。
👍