Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Conditional Video Generation for High-Efficiency Video Compression

Created by
  • Haebom

作者

Fangqiu Yi, Jingyu Xu, Jiawei Shao, Chi Zhang, Xuelong Li

概要

本論文は、人間の視覚的認知に適合するビデオコンテンツの再構成に優れた条件付き拡散モデルを活用して、知覚的に最適化されたビデオ圧縮フレームワークを提案します。ビデオ圧縮を希少だが情報豊富な信号から生成モデルがビデオを合成する条件付き生成作業で再構成し、静的シーン構造と動的時空間キューの両方を捉える多粒子条件化、意味豊かさを犠牲にせず効率的な伝送用に設計されたコンパクト表現、そして単一モダリティへの過度の依存を防止し、強力使用した多条件トレーニングという3つの主要モジュールを導入します。広範な実験により、提案された方法は、特に高い圧縮率で、Fréchet Video Distance(FVD)やLPIPSなどの知覚品質測定基準で、既存のコーデックとニューラルコーデックの両方を大幅に上回ることを示しています。

Takeaways、Limitations

Takeaways:
条件付き拡散モデルを用いた新しいビデオ圧縮フレームワークの提示
従来とニューラルコーデックに比べて高い圧縮率で優れた知覚品質を達成(FVD、LPIPSベース)
多粒子条件化,コンパクト表現,多条件訓練による効率的で強力な圧縮性能の実現
Limitations:
提案された方法の計算の複雑さとメモリ要件の分析不足
さまざまなビデオタイプとコンテンツの一般化パフォーマンス評価の欠如
実際の実装と適用の詳細な説明の欠如
👍