Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Amélioration de la sensibilité temporelle d'un grand modèle linguistique pour la recommandation avec un réglage contrefactuel

Created by
  • Haebom

Auteur

Yutian Liu, Zhengyi Yang, Jiancan Wu, Xiang Wang

Contour

Cet article présente les tendances récentes de la recherche dans l'application des modèles linguistiques à grande échelle (MLH) à la recommandation séquentielle. Les méthodes existantes basées sur les MLH ne parviennent pas à exploiter pleinement la richesse des informations temporelles inhérentes aux séquences d'interaction passées d'un utilisateur. En effet, le mécanisme d'auto-attention des MLH manque intrinsèquement d'informations séquentielles et repose sur des inclusions positionnelles, moins adaptées aux séquences d'interaction utilisateur que le langage naturel. Pour pallier ces limitations, nous proposons un cadre temporel contrefactuel amélioré pour la recommandation basée sur les MLH (CETRec) , qui sépare et mesure l'influence des informations temporelles selon des principes d'inférence causale . Le CETRec améliore efficacement la compréhension des MLH de l'ordre absolu (temps d'interaction avec les éléments) et de l'ordre relatif (relations séquentielles entre les éléments) en utilisant des ajustements contrefactuels issus de l'analyse causale. Nous démontrons l'efficacité du CETRec par des expériences approfondies sur des ensembles de données réels.

Takeaways, Limitations

Takeaways:
Une nouvelle approche pour améliorer les performances des systèmes de recommandation séquentielle basés sur LLM.
Clarifier et exploiter l’importance de l’information temporelle en utilisant l’inférence causale.
Capturez avec précision les changements de préférences des utilisateurs en prenant en compte les informations d’ordre temporel absolu et relatif.
Validation de l'efficacité par des résultats expérimentaux utilisant des ensembles de données réels
Limitations:
Une vérification supplémentaire des performances de généralisation de la méthode proposée est nécessaire.
Des études d’applicabilité pour d’autres types de systèmes de recommandation ou d’ensembles de données sont nécessaires.
Une analyse plus approfondie du coût et de la complexité du calcul est nécessaire.
👍