Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

HiTeC : Apprentissage contrastif hiérarchique sur hypergraphe à attributs textuels avec augmentation sémantique

Created by
  • Haebom

Auteur

Mengting Pan, Fan Li, Xiaoyang Wang, Wenjie Zhang, Xuemin Lin

Contour

Cet article propose HiTeC, un nouveau cadre d'apprentissage auto-supervisé sur les hypergraphes à attributs textuels (TAHG). Nous soulignons les limites des méthodes d'apprentissage contrastif existantes, qui ne parviennent pas à exploiter efficacement l'information textuelle des TAHG, souffrent du bruit dû à l'augmentation aléatoire des données et peinent à capturer les dépendances à longue portée. HiTeC comprend une étape de pré-apprentissage de l'encodeur de texte utilisant une fonction objective contrastive sensible à la structure, suivie d'une seconde étape utilisant des stratégies d'augmentation sensibles à la sémantique, telles que l'augmentation de texte améliorée par les invites et la suppression des hyperarêtes sensibles à la sémantique. De plus, nous proposons une fonction de perte contrastive multi-échelle qui capture mieux les dépendances à longue portée grâce à la contrastivité au niveau des sous-graphes basée sur la marche en S. Cette conception en deux étapes dissocie le pré-apprentissage de l'encodeur de texte de l'apprentissage contrastif de l'hypergraphe, améliorant ainsi l'évolutivité et préservant la qualité de la représentation. Nous démontrons l'efficacité de HiTeC par des expériences approfondies.

Takeaways, Limitations

Takeaways:
Nous présentons HiTeC, un nouveau cadre efficace et évolutif pour l'apprentissage auto-supervisé sur des hypergraphes avec des propriétés textuelles.
Surmonter les limites des méthodes existantes grâce à des stratégies d’apprentissage contrastif tenant compte de la structure et d’augmentation de la conscience sémantique.
Capture efficace des dépendances à longue portée avec des fonctions de perte contrastives multi-échelles.
ÉVolutivité améliorée en séparant la préformation de l'encodeur de texte et l'apprentissage contrastif de l'hypergraphe grâce à une conception en deux étapes.
Limitations:
Il est possible que les améliorations de performances de HiTeC soient limitées à certains types de TAHG.
Des recherches supplémentaires sont nécessaires pour optimiser les paramètres de la stratégie d’augmentation de la reconnaissance sémantique proposée.
La complexité de calcul des fonctions de perte contrastives multi-échelles peut être élevée.
Une validation supplémentaire de l’applicabilité et des performances de généralisation sur des ensembles de données à grande échelle du monde réel est nécessaire.
👍