Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

SPARC : Modèle de recherche multi-intérêts adaptatif probabiliste souple via des livres de codes pour système de recommandation

Created by
  • Haebom

Auteur

Jialiang Shi, Yaguang Dou, Tian Qi

Contour

Cet article propose un nouveau cadre de recherche, SPARC (Soft Probabilistic Adaptive Retrieval Model via Codebooks), pour répondre à trois défis clés de la modélisation multi-intérêts dans les systèmes de recommandation pratiques (RS) : 1. intérêts invariants extraits de connaissances externes prédéfinies ; 2. stratégies de surexploitation axées sur la correspondance des intérêts existants ; et 3. manque de découverte de nouveaux intérêts. SPARC utilise un auto-encodeur variationnel quantifié résiduel (RQ-VAE) pour construire un espace d'intérêts discret, qui est ensuite entraîné parallèlement à un modèle de recommandation à grande échelle pour exploiter les intérêts comportementaux qui évoluent dynamiquement et reflètent les retours des utilisateurs. De plus, un module d'intérêts probabilistes qui prédit la distribution de probabilité sur l'ensemble de l'espace d'intérêts discrets dynamiques permet une stratégie de « recherche douce » efficace lors de l'inférence en ligne, faisant passer le paradigme de la correspondance passive à l'exploration active et facilitant efficacement la découverte d'intérêts. Les tests A/B effectués sur une plateforme sectorielle comptant des dizaines de millions d'utilisateurs actifs quotidiennement ont produit des résultats significatifs, notamment une augmentation de 0,9 % du temps de visionnage, de 0,4 % des pages vues (PV) et de 22,7 % des PV500 (nouveau contenu atteignant 500 PV en 24 heures). Les évaluations hors ligne utilisant l'ensemble de données Amazon Product ont également montré des améliorations constantes de mesures telles que Recall@K et NDCG@K.

Takeaways, Limitations_

Takeaways:
Nous présentons la possibilité de construire un espace d'intérêt dynamique et discret en utilisant RQ-VAE et en reflétant les préférences des utilisateurs en temps réel grâce à l'exploration d'intérêts basée sur le comportement.
Exploration et découverte actives d'intérêts grâce à une stratégie de « recherche douce » utilisant le module d'intérêt probabiliste.
Efficacité pratique validée par des tests A/B sur des plateformes industrielles à grande échelle. Améliorations significatives des indicateurs clés tels que le temps de consultation des utilisateurs, les pages vues et la portée des nouveaux contenus.
Vérification supplémentaire de l’amélioration des performances de l’algorithme grâce à une évaluation hors ligne.
Limitations:
Manque de discussion sur la complexité et le coût de calcul de la construction d'espaces d'intérêt à l'aide de RQ-VAE.
Des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité des résultats à des plateformes industrielles spécifiques.
Manque de description claire des détails et des étapes de prétraitement de l'ensemble de données de produits Amazon utilisé.
Une analyse plus approfondie est nécessaire pour déterminer l’adaptabilité du modèle aux changements à long terme du comportement des utilisateurs.
👍