Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Scaffold Diffusion: Sparse Multi-Category Voxel Structure Generation with Discrete Diffusion

Created by
  • Haebom

作者

Justin Jung

概要

本論文では,希少多カテゴリー3Dボクセル構造の生成の難しさ,特にボクセル構造の立方メモリスケーリングと希少性に起因する重大なクラス不均衡問題を解決するためにScaffold Diffusionという生成モデルを提案した。 Scaffold Diffusionはボクセルをトークンとして扱い、離散拡散言語モデルを使用して3Dボクセル構造を作成します。この論文は、離散拡散言語モデルが、テキストなどの本質的に連続した領域を超えて空間的に一貫した3D構造を生成するように拡張できることを示しています。 3D-CraftデータセットのMinecraft住宅構造の評価は、既存の基準モデルと自己回帰式とは異なり、Scaffold Diffusionが98%以上の希少性を持つデータで学習された場合でも、現実的で一貫した構造を生成することを示しています。生成されたサンプルと生成プロセスを可視化できるインタラクティブビューアも提供します( https://scaffold.deepexploration.org/ )。

Takeaways、Limitations

Takeaways:
希少多カテゴリー3Dボクセル構造を生成するための効果的な新しい方法の提示
離散拡散言語モデルの空間構造生成への拡張可能性を証明
98%以上の希少性を持つデータでも、現実的で一貫した3D構造生成可能。
作成プロセスを可視化するためのインタラクティブビューアを提供します。
Limitations:
提示された方法の他のタイプの3Dデータまたはより複雑な構造の一般化性能に関するさらなる研究の必要性
3D-Craftデータセットの評価結果のみが提示され、他のデータセットの一般化性能検証が必要です。
メモリスケーリング問題に対する具体的な解決策ではなく,離散拡散言語モデルを活用したバイパスアプローチの採用
👍