Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

${C}^{3}$-GS: Learning Context-aware, Cross-dimension, Cross-scale Feature for Generalizable Gaussian Splatting

Created by
  • Haebom

作者

Yuxi Hu, Jun Zhang, Kuangyi Chen, Zhe Zhang, Fr​​iedrich Fraundorfer

概要

この論文は、シーンごとの最適化なしに新しいシーンの新しいビューを合成する一般化可能なGaussian Splattingを目指しています。従来のフィードフォワードネットワークを使用してピクセルごとのガウシアンパラメータを予測する方法は高品質の合成を可能にしましたが、稀な入力ビューから正確な幾何学を構築することは困難です。これを解決するために、本論文では、文脈認識、クロス次元、クロススケール制約を組み込んで特徴学習を向上させる $\mathbf{C}^{3}$-GS フレームワークを提案します。 $\mathbf{C}^{3}$-GSは3つの軽量モジュールを統合し、追加の監督なしでリアルな合成を可能にします。ベンチマークデータセットの広範な実験により、$\mathbf{C}^{3}$-GSが最先端のレンダリング品質と一般化能力を達成することを確認します。コードはhttps://github.com/YuhsiHu/C3-GSで確認できます。

Takeaways、Limitations

Takeaways:
希少なビューでも正確な幾何学を持つ高品質の画像合成が可能。
付加的な監督なしで現実的な合成可能。
文脈認識、クロス次元、クロススケール制約による改善された特徴学習
最先端のレンダリング品質と一般化能力を達成。
公開されたコードを通じて再現性を確保。
Limitations:
提示された方法のLimitationsの議論の欠如。
さまざまな種類のシーンの一般化性能の追加分析が必要
計算コストとメモリ効率の評価が必要
👍