Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

${C}^{3}$-GS : Apprentissage d'une fonctionnalité contextuelle, interdimensionnelle et inter-échelle pour un étalement gaussien généralisable

Created by
  • Haebom

Auteur

Yuxi Hu, Jun Zhang, Kuangyi Chen, Zhe Zhang, Friedrich Fraundorfer

Contour

Cet article vise à développer une méthode d'éclaboussure gaussienne généralisable, synthétisant de nouvelles vues de nouvelles scènes sans optimisation spécifique. Si les méthodes existantes, qui estiment les paramètres gaussiens par pixel à l'aide de réseaux à propagation directe, permettent une synthèse de haute qualité, elles peinent à construire une géométrie précise à partir de vues d'entrée éparses. Pour remédier à ce problème, nous proposons le framework $\mathbf{C}^{3}$-GS, qui intègre la prise en compte du contexte, la transdimensionnalité et les contraintes trans-échelles afin d'améliorer l'apprentissage des caractéristiques. $\mathbf{C}^{3}$-GS intègre trois modules légers pour réaliser une synthèse réaliste sans supervision supplémentaire. Des expériences approfondies sur des jeux de données de référence démontrent que $\mathbf{C}^{3}$-GS atteint une qualité de rendu et une capacité de généralisation de pointe. Le code est disponible à l'adresse https://github.com/YuhsiHu/C3-GS .

Takeaways, Limitations

Takeaways:
Synthèse d'images de haute qualité avec une géométrie précise même à partir de vues clairsemées.
Composition réaliste possible sans supervision supplémentaire.
Apprentissage de fonctionnalités amélioré avec des contraintes contextuelles, interdimensionnelles et inter-échelles.
Obtenir une qualité de rendu et des capacités de généralisation de pointe.
La reproductibilité est assurée grâce à un code ouvert.
Limitations:
Manque de discussion de Limitations de la méthode proposée.
Une analyse plus approfondie des performances de généralisation pour différents types de scènes est nécessaire.
Une évaluation du coût de calcul et de l’efficacité de la mémoire est nécessaire.
👍