[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Vers une compréhension de la généralisabilité des prédicteurs de liens sous les changements de distribution

Created by
  • Haebom

Auteur

Jay Revolinsky, Harry Shomer, Jiliang Tang

Contour

Dans cet article, nous montrons que, bien que les modèles de prédiction de liens (LP) de pointe affichent d'excellentes performances sur des jeux de données de référence, en situation réelle, les distributions des échantillons d'entraînement, de validation et de test ne représentent pas l'intégralité de la distribution des jeux de données. Alors que les travaux précédents se concentraient principalement sur les tâches au niveau des nœuds et des graphes, cet article aborde la question du décalage des jeux de données pour les tâches au niveau des liens. Pour résoudre ce problème, nous proposons une nouvelle stratégie de fractionnement, LPShift, qui induit un décalage distributionnel contrôlé en exploitant des caractéristiques structurelles. Nous évaluons expérimentalement des modèles LP de pointe sur 16 jeux de données mutés par LPShift, démontrant des améliorations spectaculaires des performances du modèle, et démontrons par des expériences supplémentaires que la structure du graphe affecte significativement le succès des méthodes de généralisation existantes.

Takeaways, Limitations

Takeaways:
Nous soulignons l’importance du changement d’ensemble de données dans les problèmes de prédiction de liens du monde réel et proposons une nouvelle stratégie de fractionnement, LPShift, pour résoudre ce problème.
LPShift offre une nouvelle perspective sur les performances de généralisation des modèles LP existants.
Nous démontrons expérimentalement l’impact de la structure du graphe sur les performances de généralisation du modèle.
Limitations:
Des recherches supplémentaires sont nécessaires pour déterminer si la stratégie LPShift est applicable à tous les types d’ensembles de données graphiques et de modèles LP.
Il existe un manque d’analyse sur le coût de calcul et l’efficacité de la stratégie LPShift proposée.
Des recherches supplémentaires sont nécessaires sur la robustesse de LPShift face à différents types de modifications d’ensembles de données.
👍