Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

ÉTude de la robustesse de l'apprentissage contrefactuel pour classer les modèles : une étude de reproductibilité

Created by
  • Haebom

Auteur

Zechun Niu, Zhilin Zhang, Jiaxin Mao, Qingyao Ai, Ji-Rong Wen

Contour

Cet article examine la robustesse des modèles de classement contrefactuels (CLTR) existants au moyen d'expériences approfondies basées sur la simulation. Afin d'améliorer les études de simulation existantes (T47508) qui utilisent des modèles de classement de base faibles, des modèles de simulation utilisateur simplifiés et un nombre fixe de journaux de clics synthétiques, nous menons des expériences avec des modèles de classement de base aux performances variables, plusieurs modèles de simulation utilisateur et un nombre variable de sessions synthétiques. Nos résultats expérimentaux montrent que les modèles IPS-DCM, DLA-PBM et UPE surpassent les autres modèles CLTR dans divers contextes de simulation. De plus, nous constatons que les modèles CLTR existants ne surpassent souvent pas les modèles de base de clics simples lorsque le modèle de classement de base est performant et que le nombre de sessions d'apprentissage est limité, ce qui suggère la nécessité de nouveaux algorithmes CLTR pour répondre à ces conditions.

Takeaways, Limitations

Takeaways:
Nous avons vérifié la robustesse des modèles IPS-DCM, DLA-PBM et UPE dans divers paramètres de simulation.
Nous avons montré que les modèles CLTR existants ne parviennent souvent pas à surpasser les modèles simples basés sur les clics dans des conditions de modèles de classement de base solides et d'un nombre limité de sessions de formation.
Cela soulève la nécessité de développer un nouvel algorithme CLTR adapté aux modèles de classement de base robustes et aux conditions de données de formation limitées.
Limitations:
Comme il s’agit toujours d’une étude basée sur la simulation, les performances dans des environnements réels peuvent varier.
Les résultats peuvent être affectés par le type et le nombre de modèles de simulation utilisateur et de modèles de classement de base utilisés.
Manque de validation à l'aide de données de journaux de clics à grande échelle et du monde réel.
👍