Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Enseñando al docente: mejora de la destilabilidad de redes neuronales para la regresión simbólica mediante regularización jacobiana

Created by
  • Haebom

Autor

Soumyadeep Dhar, Kei Sen Fong, Mehul Motani

Describir

Este artículo propone un método para destilar redes neuronales a gran escala en fórmulas simbólicas simples y comprensibles. Los métodos existentes presentan el problema de generar modelos de estudiante de baja precisión, ya que las funciones aprendidas por las redes neuronales complejas son inadecuadas para el descubrimiento de símbolos. Para abordar este problema, este artículo presenta un nuevo paradigma de entrenamiento que, en lugar de destilar manualmente redes neuronales preentrenadas, introduce la regularización basada en jacobianos . Esto induce a una red neuronal "maestra" a aprender funciones que no solo son precisas, sino también inherentemente fluidas y adecuadas para la destilación. Experimentos en diversos puntos de referencia de regresión del mundo real demuestran la eficacia del método propuesto. Al optimizar la fuerza de regularización para cada problema, logramos una mejora promedio del 120 % (relativa) en la puntuación $R^2$ del modelo simbólico destilado final, en comparación con una secuencia de destilación estándar , manteniendo la precisión predictiva del modelo maestro. En conclusión, este estudio presenta un método práctico y basado en principios para mejorar significativamente la precisión de los modelos interpretables extraídos de redes neuronales complejas.

Takeaways, Limitations

Takeaways:
Demostramos que la regularización basada en jacobianos puede mejorar significativamente la precisión de los modelos simbólicos durante la destilación de redes neuronales.
Presentamos un método novedoso para extraer de forma eficaz modelos comprensibles e interpretables para los humanos de redes neuronales complejas.
Presentamos metodologías prácticas aplicables a problemas del mundo real.
Limitations:
La eficacia del método propuesto depende de la optimización de la fuerza de regularización para cada problema, y el proceso de optimización en sí puede generar costos computacionales adicionales.
Se necesita más investigación sobre el rendimiento de la generalización en diferentes tipos de redes neuronales y conjuntos de datos.
Tal vez sea necesario un análisis más profundo del contexto teórico de la regularización basada en el modelo jacobiano.
👍