[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Búsqueda de espacios de programas latentes

Created by
  • Haebom

Autor

Matthew V. Macfarlane, Clement Bonnet

Describir

En este artículo, proponemos una arquitectura novedosa: la Red de Programas Latentes (LPN). LPN combina el poder de generalización de la síntesis de programas con la escalabilidad del aprendizaje profundo al incorporar la búsqueda directa en el modelo neuronal durante la prueba. Para abordar el problema de la explosión combinatoria de los métodos de síntesis de programas existentes y la falta de adaptabilidad de los métodos de aprendizaje profundo durante la prueba, LPN aprende un espacio latente de programas implícitos que mapea las entradas con las salidas y realiza la búsqueda en este espacio mediante gradientes durante la prueba. Demuestra un rendimiento comparable o superior al de los métodos existentes en diversas tareas de programación por ejemplos sin necesidad de un lenguaje específico de dominio predefinido, y demuestra su capacidad para aprender y buscar en el espacio de programas latentes para adaptarse a nuevas tareas en el benchmark ARC-AGI. La habilitación de la búsqueda durante la prueba duplica el rendimiento en tareas fuera de distribución.

Takeaways, Limitations

Takeaways:
Presentamos una novedosa arquitectura LPN que combina las ventajas de la síntesis de programas y el aprendizaje profundo.
Adaptabilidad mejorada a tareas fuera de distribución mediante búsqueda en tiempo de prueba.
Dependencia reducida de lenguajes específicos del dominio predefinidos.
Validación de la practicidad a través de mejoras de desempeño en el benchmark ARC-AGI.
Limitations:
Se necesitan más investigaciones sobre el tamaño del espacio latente y la eficiencia de búsqueda de LPN.
Se necesitan más evaluaciones del desempeño de generalización para diferentes tipos de tareas.
Es necesario analizar la complejidad y el coste computacional de LPN.
👍