Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

How to Move Your Dragon: Text-to-Motion Synthesis for Large-Vocabulary Objects

Created by
  • Haebom

作者

Wonkwang Lee, Jongwon Jeong, Taehong Moon, Hyeon-Jong Kim, Jaehyeon Kim, Gunhee Kim, Byeong-Uk Lee

概要

この論文は、さまざまなオブジェクトの種類に対する動作合成の可能性を強調し、高品質の動作と注釈が豊富な包括的な動作データセットの欠如と、さまざまなオブジェクトの不均一なスケルトンテンプレート処理能力の欠如という2つの主な課題を解決します。これを行うには、Truebones Zooデータセットを拡張して詳細なテキスト説明を追加し、さまざまなモーションデータを生成しながら一貫したダイナミクスを維持するリギングエンハンスメント技術を導入し、任意のスケルトンテンプレートに動的に適応するモーション拡散モデルを再設計します。実験の結果、提案された方法が多様であっても見えない物体についてもテキスト記述から高忠実度の動きを生成することを示し、様々な物体カテゴリとスケルトンテンプレートにまたがる動き合成の強力な基盤を設けます。定性的な結果はhttps://t2m4lvo.github.ioで確認できます。

Takeaways、Limitations

Takeaways:
さまざまな種類の動物の動きを含むTruebones Zooデータセットにテキストの説明を追加することで、テキストベースの動きの合成に合わせて改善しました。
様々な骨格構造に適用できるように,リギング増強技術に動的に適応する運動拡散モデルを提示した。
様々な物体、未知の物体に対しても高品質な動作合成が可能であることを実験的に示した。
テキストベースの動作合成の分野に新たな可能性を提示した。
Limitations:
Truebones Zooデータセットに基づいているため、他の種類のオブジェクトの一般化パフォーマンスにはさらに研究が必要です。
リギングエンハンスメント技術の効率と限界のさらなる分析が必要です。
提案されたモデルの計算コストと複雑さに関する考察が必要です。
実際の世界データの多様性と複雑さを完全に反映できない場合があります。
👍