Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Optimisation des requêtes uniquement pour les systèmes de recommandation

Created by
  • Haebom

Auteur

Liang Guo, Wei Li, Lucy Liao, Huihui Cheng, Rui Zhang, Yu Shi, Yueming Wang, Yanzun Huang, Keke Zhai, Pengchao Wang, Timothy Shi, Xuan Cao, Shengzhi Wang, Renqin Cai, Zhaojie Gong, Omkar Vichare, Rui Jian, Leon Gao, Shiyan Deng, Xingyu Liu, Xiong Zhang, Fu Li, Wenlei Xie, Bin Wen, Rui Li, Xing Liu, Jiaqi Zhai

Contour

Cet article présente les optimisations basées sur les requêtes (ROO), un nouveau paradigme d'apprentissage et de modélisation visant à améliorer l'efficacité et les performances des modèles de recommandation d'apprentissage profond (DLRM) à grande échelle. ROO traite les requêtes des utilisateurs comme des unités de données, économisant ainsi de l'espace de stockage par rapport au traitement traditionnel basé sur les impressions des utilisateurs. Il élimine également les calculs et les communications redondants pour plusieurs impressions au sein d'une requête, permettant ainsi à une architecture de réseau neuronal évolutive de mieux capter les signaux d'intérêt des utilisateurs. Ceci est rendu possible par la co-conception des données (données basées sur les requêtes), de l'infrastructure (pipelines de traitement des données basées sur les requêtes) et de l'architecture du modèle (architectures de réseau neuronal basées sur les requêtes). Ce système est particulièrement avantageux pour les architectures basées sur les requêtes telles que les modèles de recommandation génératifs (GR).

Takeaways, Limitations

Takeaways:
Réduisez l'espace de stockage des données : éliminez les données redondantes en traitant les demandes des utilisateurs données par données.
Efficacité d'apprentissage améliorée : éliminez les calculs et les communications redondants pour plusieurs expositions au sein d'une demande.
Amélioration des performances du modèle : capture plus précise des signaux d’intérêt des utilisateurs grâce à des architectures de réseaux neuronaux évolutives.
Potentiel accru d’exploitation de nouvelles architectures telles que les modèles de recommandation génératifs.
Limitations:
Manque de détails techniques spécifiques sur la mise en œuvre et l’application réelles du paradigme ROO.
Une validation supplémentaire de la généralisabilité à travers différents types de systèmes de recommandation et d’ensembles de données est nécessaire.
Des recherches supplémentaires sont nécessaires sur la conception et l’optimisation des architectures basées uniquement sur les requêtes.
👍