Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Complete Gaussian Splats from a Single Image with Denoising Diffusion Models

Created by
  • Haebom

作者

Ziwei Liao, Mohamed Sayed, Steven L. Waslander, Sara Vicente, Daniyar Turmukhambetov, Michael Firman

概要

本論文は,単一画像からガウススプラットを用いて完全な3Dシーンを再構成する新しい方法を提案した。従来のガウススプラッティング技術は、密集した観測データを必要とし、閉塞または観測されていない領域を再構成するのに困難を経験している。この研究では、潜在的な拡散モデルを活用して、単一の画像だけで閉塞部分を含む完全な3Dシーンを再構築します。閉塞領域の表面を完成させることは曖昧さのために困難な問題であり、従来の方法は単一の「モード」を予測する回帰ベースの方法を使用してぼやけ、非現実性、多重解釈不可能などの問題を引き起こす。一方,本研究​​では,単一の入力画像を条件としてガウススプラットの3D表現分布を学習する生成的方法を提案した。正解データ不足の問題を解決するために、自己地図学習方式で2D画像のみを使用して潜在空間を学習する変分自動再構成器を提案し、これに基づいて拡散モデルを学習します。その結果、この方法は忠実な再構成とさまざまなサンプルを生成し、高品質の360度レンダリングのために閉塞した表面を完成させることができます。

Takeaways、Limitations

Takeaways:
単一画像から閉塞領域を含む完全な3Dシーン再構成可能
既存の方法のぼやけ、非現実性のトラブルシューティング
様々な可能性を持つ3D表現生成可能
高品質360度レンダリング可能
自己地図学習に基づく効率的な潜在空間学習
Limitations:
提案されたVariational AutoReconstructorのパフォーマンスの詳細な分析の欠如
実際の複雑なシーンの一般化性能評価が必要
大規模データセットのスケーラビリティ評価が必要
計算コストと処理時間の分析不足
👍