Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

EarthCrafter: Scalable 3D Earth Generation via Dual-Sparse Latent Diffusion

Created by
  • Haebom

作者

Shang Liu, Chenjie Cao, Chaohui Yu, Wen Qian, Jing Wang, Fan Wang

概要

この論文では、地理的に広大な地域(数千平方キロメートル)の3Dモデルを作成することの難しさについて説明します。これを解決するために、50,000の600m x 600mサイズのアメリカ本土のグローバル航空写真で構成される大規模な3D航空データセットAerial-Earth3Dを提示します。このデータセットには、マルチビュー画像、奥行きマップ、法線、セマンティックセグメンテーション、カメラの位置情報が含まれ、品質管理を通じて地形の多様性を保証します。これに基づいて、論文は、希少分離潜在拡散を用いた大規模な3D地球生成のためのEarthCrafterフレームワークを提案します。 EarthCrafterは、構造とテクスチャ生成を分離し、高解像度の幾何学的なボクセルと2Dガウススプラット(2DGS)を圧縮された潜在空間に変換するデュアルレア3D-VAEを使用して計算コストを削減します。さらに、意味、画像、またはその両方を組み合わせた入力で訓練された条件認識フローマッチングモデルを使用して、潜在的なジオメトリとテクスチャの特徴を独立して柔軟にモデル化します。実験の結果、EarthCrafterは大規模な生成から優れたパフォーマンスを発揮し、セマンティック誘導都市レイアウトの作成から無条件の地形合成まで、さまざまなアプリケーションをサポートしています。

Takeaways、Limitations

Takeaways:
大規模な3D地球を作成するための新しいデータセットAerial-Earth3DとフレームワークEarthCrafterを提示します。
希少分離潜在拡散技術を用いた大規模生成の計算コスト問題の解決
セマンティック誘導生成と無条件地形合成を含む多様な応用性の提示
地理的妥当性を維持しながら様々な地形を生成可能。
Limitations:
Aerial-Earth3Dデータセットは米国本土に限定されています。世界的な拡張の難しさ。
EarthCrafterのパフォーマンス評価は特定のデータセットに限定され、一般化の可能性に関するさらなる研究が必要です。
潜在空間圧縮による情報損失の可能性
モデルの計算複雑度の詳細な分析の欠如
👍