Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Conditional Video Generation for High-Efficiency Video Compression

Created by
  • Haebom

作者

Fangqiu Yi, Jingyu Xu, Jiawei Shao, Chi Zhang, Xuelong Li

概要

本論文は、人間の視覚的認知に適合するビデオコンテンツの再構成に優れた条件付き拡散モデルを活用して、知覚的に最適化されたビデオ圧縮フレームワークを提案します。ビデオ圧縮を稀ですが、情報豊富な信号から生成モデルがビデオを合成する条件付き生成作業で再構成し、静的シーン構造と動的時空間手がかりをともに捉える多粒子条件化、意味豊かさを犠牲にせず効率的な伝送用に設計された圧縮表現、そして単一モダリティへの過度な依存を防止し、堅牢性を向上させる条件訓練という3つの主要モジュールを導入します。広範な実験により、提案された方法は、特に高圧縮率でFréchet Video Distance(FVD)やLPIPSなどの知覚品質指標で既存および神経コーデックを大幅に上回ることを示しています。

Takeaways、Limitations

Takeaways:
条件付き拡散モデルを用いた新しいビデオ圧縮フレームワークの提示
従来とニューラルコーデックに比べ高圧縮率で優れた知覚品質を実現
多粒子条件化,圧縮表現,多条件訓練による効率と堅牢性の向上
Limitations:
提案した方法の計算の複雑さとリアルタイム処理の可能性の分析不足
さまざまなビデオタイプとコンテンツの一般化パフォーマンス評価が不十分
圧縮ビデオのビットレートと知覚品質の間の定量的関係分析の欠如
👍