Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

OptiScene: LLM-driven Indoor Scene Layout Generation via Scaled Human-aligned Data Synthesis and Multi-Stage Preference Optimization

Created by
  • Haebom

作者

Yixuan Yang, Zhen Luo, Tongsheng Ding, Junru Lu, Mingqi Gao, Jinyu Yang, Victor Sanchez, Feng Zheng

概要

本稿では、屋内レイアウトを作成するための大規模な合成データセット3D-SynthPlaceと最適化されたオープンソースLLMであるOptiSceneを紹介します。既存のプロンプトベースの方法と学習ベースの方法の限界を克服するために、「GPT合成、人間検査」パイプラインを通じて生成された17,000の合成レイアウトを含む3D-SynthPlaceを構築しました。 OptiSceneは、3D-SynthPlaceデータセットを用いて、監督学習と多回目直接選好最適化(DPO)による2段階学習過程を経て微調整された。 OptiSceneは、高品質のレイアウト作成と高い成功率を示し、従来の方法より優れた性能を示すことを実験を通じて実証した。また、シーン編集やロボットナビなどのインタラクティブな作業でも有望な可能性を示しています。

Takeaways、Limitations

Takeaways:
大規模で高品質の合成データセット3D-SynthPlaceを提供することで、屋内レイアウト作成の研究開発に貢献
既存の方法の限界を克服する強力なオープンソースLLMであるOptiSceneを提示。
監督学習と多重DPOを組み合わせた効果的な訓練方法の提示
シーン編集やロボットナビなど様々な応用分野に活用可能性を提示。
Limitations:
合成データセットの制限による実際の世界データとの差の存在の可能性。
DPOの計算コストが高い可能性があります。
さまざまなスタイルとレイアウトの一般化パフォーマンス評価を追加する必要があります。
4つの部屋の種類の制限。
👍