Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Démêler les modèles de forme normale disjonctive neuronale

Created by
  • Haebom

Auteur

Kexin Gu Baugh, Vincent Perreault, Matthew Baugh, Luke Dickens, Katsumi Inoue, Alessandra Russo

Contour

Cet article présente une nouvelle solution pour remédier à la dégradation des performances des modèles neuronaux de forme normale disjonctive (N-DNF). Nous démontrons que les modèles N-DNF existants souffrent d'une dégradation des performances due au seuillage lors du processus de transformation symbolique post-apprentissage, dû à l'incapacité de séparer les connaissances apprises représentées dans les pondérations du réseau. Nous abordons ce problème en proposant une nouvelle méthode de démêlage qui sépare les nœuds codant des règles imbriquées en nœuds plus petits et indépendants. Nous démontrons expérimentalement que cette méthode produit des représentations logiques plus compactes et interprétables pour les tâches de classification binaire, multi-classes et multi-étiquettes (y compris celles nécessitant l'invention de prédicats), obtenant des résultats plus proches des performances du modèle original.

Takeaways, Limitations

Takeaways:
Nous avons identifié la cause du problème de dégradation des performances du modèle N-DNF et proposé une nouvelle méthode de séparation pour le résoudre.
La méthode proposée améliore l’interprétabilité du modèle N-DNF et atteint des performances proches de celles du modèle avant transformation.
Nous avons prouvé notre efficacité sur diverses tâches de classification (y compris les tâches binaires, multi-classes, multi-étiquettes et d'invention de prédicats).
La représentation logique du modèle N-DNF amélioré est plus compacte.
Limitations:
Des recherches supplémentaires sont nécessaires pour évaluer les performances de généralisation de la méthode proposée.
Une évaluation des performances pour des tâches plus complexes ou des ensembles de données plus volumineux est nécessaire.
Des recherches supplémentaires sont nécessaires pour explorer son applicabilité à d’autres types de modèles d’apprentissage neuro-symboliques.
👍