[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Recherche d'espaces de programmes latents

Created by
  • Haebom

Auteur

Matthew V Macfarlane, Clément Bonnet

Contour

Dans cet article, nous proposons une nouvelle architecture, le réseau de programmes latents (LPN). Le LPN combine la puissance de généralisation de la synthèse de programmes avec l'évolutivité de l'apprentissage profond en intégrant la recherche directe dans le modèle neuronal au moment du test. Pour résoudre le problème d'explosion combinatoire des méthodes de synthèse de programmes existantes et le manque d'adaptabilité au moment du test des méthodes d'apprentissage profond, le LPN apprend un espace latent de programmes implicites qui mappe les entrées aux sorties, et effectue une recherche dans cet espace à l'aide de gradients au moment du test. Il affiche des performances comparables, voire supérieures, aux méthodes existantes sur diverses tâches de programmation par exemples, sans nécessiter de langage spécifique prédéfini, et démontre sa capacité à apprendre et à explorer l'espace latent des programmes pour s'adapter à de nouvelles tâches sur le benchmark ARC-AGI. L'activation de la recherche au moment du test améliore les performances d'un facteur deux sur les tâches hors distribution.

Takeaways, Limitations

Takeaways:
Nous présentons une nouvelle architecture LPN qui combine les avantages de la synthèse de programmes et de l'apprentissage en profondeur.
Adaptabilité améliorée aux tâches hors distribution grâce à la recherche au moment du test.
Dépendance réduite aux langages prédéfinis spécifiques au domaine.
Validation de la praticité par des améliorations de performances sur le benchmark ARC-AGI.
Limitations:
Des recherches supplémentaires sont nécessaires sur la taille de l’espace latent et l’efficacité de recherche du LPN.
D’autres évaluations de performance de généralisation pour différents types de tâches sont nécessaires.
Une analyse de la complexité et du coût de calcul du LPN est nécessaire.
👍