Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Principes possibles pour les agents d'apprentissage à structure alignée

Created by
  • Haebom

Auteur

Lancelot Da Costa, Tom a\v{s} Gaven\v{c}iak, David Hyland, Mandana Samiei, Cristian Dragos-Manta, Candice Pattisapu, Adeel Razi, Karl Friston

Contour

Cet article présente une feuille de route pour le développement d'une intelligence artificielle (IA) évolutive et alignée, basée sur une explication des principes fondamentaux de l'intelligence naturelle. Une voie possible vers une IA évolutive et alignée consiste à permettre aux agents artificiels d'apprendre de bons modèles du monde, y compris nos préférences. Pour y parvenir, un objectif clé est de créer des agents capables d'apprendre à représenter le monde et les modèles du monde d'autres agents – un problème connu sous le nom d'apprentissage structuré (également appelé apprentissage par représentation causale ou découverte de modèles). Dans cette optique, cet article présente les principes qui nous guideront, ainsi que les problèmes d'apprentissage structuré et d'alignement, en synthétisant diverses idées issues des mathématiques, des statistiques et des sciences cognitives. 1) Nous abordons le rôle essentiel des connaissances fondamentales, de la géométrie de l'information et de la réduction de modèles dans l'apprentissage structuré, et proposons un module structurel fondamental pour l'apprentissage à partir d'un large éventail de mondes naturels. 2) Nous esquissons une voie vers des agents alignés grâce à l'apprentissage structuré et à la théorie de l'esprit. À titre d'exemple, nous exposons mathématiquement les trois lois de la robotique d'Asimov, qui recommandent aux agents d'agir avec prudence afin de minimiser les malheurs des autres agents. Nous complétons également cet exemple en proposant une approche améliorée de l'alignement. Ces observations peuvent servir de lignes directrices pour le développement d'une intelligence artificielle permettant d'étendre les systèmes d'apprentissage de structures alignées existants ou d'en concevoir de nouveaux.

Takeaways, Limitations_

Takeaways : Présente une feuille de route pour le développement d'une IA évolutive et alignée, basée sur l'intelligence naturelle. Il présente une méthode de développement d'agents alignés utilisant l'apprentissage structurel et la théorie de l'esprit. Il modélise mathématiquement les trois lois de la robotique d'Asimov et propose une méthode d'alignement améliorée. Il souligne l'importance des connaissances fondamentales, de la géométrie de l'information et de la réduction des modèles.
Limitations: La feuille de route présentée est encore théorique et nécessite une mise en œuvre et une vérification pratiques. Des recherches supplémentaires sont nécessaires pour déterminer son applicabilité à des situations complexes du monde réel, en utilisant les trois lois de la robotique d'Asimov comme exemple simplifié. Les descriptions détaillées des algorithmes d'apprentissage structurel et des conceptions de systèmes spécifiques font défaut. Des recherches supplémentaires sont nécessaires pour déterminer comment représenter et apprendre efficacement divers modèles et préférences du monde.
👍