Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Apprentissage de la représentation d'éléments relationnels multimodaux pour déduire des éléments substituables et complémentaires

Created by
  • Haebom

Auteur

Junting Wang, Chenghuan Guo, Jiao Yang, Yanhui Guo, Yan Gao, Hari Sundaram

Contour

Cet article propose MMSC, un nouveau cadre d'apprentissage relationnel multimodal basé sur l'apprentissage auto-supervisé, conçu pour inférer des éléments alternatifs et complémentaires. Les approches existantes se concentrent sur la modélisation des associations inter-éléments déduites du comportement des utilisateurs à l'aide de réseaux de neurones à réseau (GNN) ou en exploitant les informations sur le contenu des éléments, mais ont tendance à négliger les défis liés à la rareté des données en raison du bruit généré par les données comportementales des utilisateurs et des distributions à longue traîne. MMSC comprend un module d'apprentissage relationnel multimodal basé sur un modèle de base multimodal, un module d'apprentissage relationnel auto-supervisé basé sur la représentation des actions qui débruit et apprend à partir des données comportementales des utilisateurs, et un mécanisme d'agrégation hiérarchique des représentations qui intègre les représentations des éléments aux niveaux sémantique et des tâches. De plus, les LLM sont utilisés pour générer des données d'apprentissage augmentées afin d'améliorer encore le processus de débruitage pendant l'apprentissage. Des expériences approfondies sur cinq ensembles de données du monde réel démontrent que MMSC surpasse les modèles de base existants de 26,1 % en matière de recommandation alternative et de 39,2 % en matière de recommandation complémentaire, démontrant ainsi son efficacité dans la modélisation des éléments de démarrage à froid.

Takeaways, Limitations_

Takeaways:
Il aborde efficacement les problèmes de données de comportement utilisateur bruyantes et de rareté des données en combinant des informations multimodales et un apprentissage auto-supervisé.
Améliore considérablement les performances de recommandation d'articles de remplacement et complémentaires.
Améliore les performances de recommandation pour les éléments de démarrage à froid.
Nous présentons une nouvelle méthode pour améliorer les performances du modèle grâce à l'augmentation des données à l'aide de LLM.
Limitations:
Une analyse plus approfondie est nécessaire pour déterminer la fiabilité et les performances de généralisation de l’augmentation des données à l’aide de LLM.
Une évaluation des performances de généralisation sur différents types de données multimodales est nécessaire.
La vérification des performances et de l’efficacité des recommandations en temps réel dans les environnements de service réels est requise.
👍