Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Génération réversible pré-entraînée comme apprentissage de représentation visuelle non supervisé

Created by
  • Haebom

Auteur

Rongkun Xue, Jinouwen Zhang, Yazhe Niu, Dazhong Shen, Bingqi Ma, Yu Liu, Jing Yang

Contour

Dans cet article, nous proposons un cadre de génération réversible pré-entraînée (PRG) qui extrait des représentations non supervisées en inversant le processus de génération des modèles génératifs continus pré-entraînés, processus peu exploité dans les tâches discriminantes. PRG exploite la grande capacité des modèles génératifs pré-entraînés pour construire un extracteur de caractéristiques robuste et généralisable, et permet une sélection flexible de hiérarchies de caractéristiques adaptées à des sous-tâches spécifiques. Il surpasse les approches existantes sur divers benchmarks, atteignant une précision de 78 % sur ImageNet à une résolution de 64x64, et constitue la méthode de pointe parmi les méthodes basées sur des modèles génératifs. De plus, nous vérifions l'efficacité de notre approche par diverses études d'ablation et évaluations hors distribution. Le code source est disponible à l'adresse https://github.com/opendilab/PRG .

Takeaways, Limitations

Takeaways:
Suggérant la possibilité d'améliorer les performances des tâches discriminantes en utilisant des modèles génératifs pré-entraînés
Proposer un nouveau cadre qui utilise efficacement la grande capacité des modèles génératifs
Vérifier l'applicabilité de diverses sous-tâches grâce à une sélection flexible de la hiérarchie des fonctionnalités
Atteint des performances de pointe sur divers benchmarks, notamment ImageNet
Limitations:
Le Limitations spécifique n’est pas explicitement mentionné dans le document.
Des recherches supplémentaires sont nécessaires pour déterminer dans quelle mesure ce modèle génératif repose sur un modèle génératif particulier et sur sa généralisabilité à d’autres modèles génératifs.
Une évaluation des performances sur des ensembles de données plus volumineux ou des images haute résolution est nécessaire.
👍