Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Forecasting When to Forecast: Accelerating Diffusion Models with Confidence-Gated Taylor

Created by
  • Haebom

作者

Xiaoliu Guan, Lielin Jiang, Hanqi Chen, Xu Zhang, Jiaxing Yan, Guanzhong Wang, Yi Liu, Zetao Zhang, Yu Wu

概要

本論文は拡散変圧器(DiTs)の推論を高速化する新しい方法を提案する。従来のTaylorSeerは、すべてのトランスブロックの中間的な特徴をキャッシュして、テイラー展開を通じて将来の特徴を予測しますが、メモリと計算のオーバーヘッドが大きく予測精度を考慮に入れないという制限があります。本論文では、テイラー予測対象を最後のブロックに変更してキャッシュする特徴の数を減らし、最初のブロックの予測エラーに基づいて動的なキャッシュメカニズムを提案します。これにより、速度と品質のバランスを改善し、FLUX、DiT、Wan Videoでそれぞれ3.17倍、2.36倍、4.14倍の推論速度向上を達成しました。

Takeaways、Limitations

Takeaways:
既存のTaylorSeerのLimitationsである高メモリと計算オーバーヘッドを効果的に解決しました。
動的なキャッシングメカニズムにより、予測精度に基づいて柔軟に推論速度を調整します。
様々なDiTモデルにおいて速度向上と品質維持を同時に達成した。
Limitations:
提案された方法の効率は、最初のブロックの予測誤差への依存度が高いです。誤差推定の正確さによっては、パフォーマンスが影響を受ける可能性があります。
特定のモデル(FLUX、DiT、Wan Video)の実験結果のみが提示され、他のモデルの一般化の可能性には追加の検証が必要です。
動的キャッシュメカニズムのパラメータ(エラー許容量など)の最適化の詳細な説明はありません。
👍