Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Desenredando los modelos de forma normal disyuntiva neuronal

Created by
  • Haebom

Autor

Kexin Gu Baugh, Vincent Perreault, Matthew Baugh, Luke Dickens, Katsumi Inoue, Alessandra Russo

Describir

Este artículo presenta una solución novedosa para abordar la degradación del rendimiento de los modelos neuronales de forma normal disyuntiva (N-DNF). Demostramos que los modelos N-DNF existentes sufren una degradación del rendimiento debido a la umbralización durante el proceso de transformación simbólica posterior al entrenamiento, lo cual se debe a la imposibilidad de separar el conocimiento aprendido representado en los pesos de la red. Abordamos este problema proponiendo un nuevo método de desenredo que separa los nodos que codifican reglas anidadas en nodos más pequeños e independientes. Demostramos experimentalmente que este método produce representaciones lógicas más compactas e interpretables para tareas de clasificación binaria, multiclase y multietiqueta (incluidas aquellas que requieren invención de predicados), logrando resultados más cercanos al rendimiento del modelo original.

Takeaways, Limitations

Takeaways:
Identificamos la causa del problema de degradación del rendimiento del modelo N-DNF y propusimos un nuevo método de separación para resolverlo.
El método propuesto mejora la interpretabilidad del modelo N-DNF y logra un rendimiento cercano al del modelo antes de la transformación.
Hemos demostrado ser eficaces en diversas tareas de clasificación (incluidas las binarias, de múltiples clases, de múltiples etiquetas y de invención de predicados).
La representación lógica del modelo N-DNF mejorado es más compacta.
Limitations:
Se necesita más investigación para evaluar el rendimiento de generalización del método propuesto.
Se requiere evaluación del desempeño para tareas más complejas o conjuntos de datos más grandes.
Se necesita más investigación para explorar su aplicabilidad a otros tipos de modelos de aprendizaje neurosimbólico.
👍