Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
ACMP: Paso de mensajes de Allen-Cahn con fuerzas atractivas y repulsivas para redes neuronales gráficas
Created by
Haebom
Autor
Yuelin Wang, Kai Yi, Xinliang Liu, Yu Guang Wang, Shi Jin
Describir
En este artículo, modelamos el paso de mensajes neuronales, la unidad fundamental de extracción de características para datos con estructura de grafos, como un sistema de partículas en interacción con fuerzas de atracción y repulsión, y fuerzas de Allen-Cahn que surgen del modelado de transición de fase. La dinámica del sistema es un proceso de reacción-difusión no explosivo que separa partículas. Esto conduce al paso de mensajes de Allen-Cahn (ACMP) para redes neuronales de grafos, donde las iteraciones numéricas de la solución del sistema de partículas constituyen la propagación del paso de mensajes. ACMP, que puede implementarse simplemente usando un solucionador de EDO neuronales, puede aumentar la profundidad de la red hasta 100 capas con un límite inferior estrictamente positivo, teóricamente probado, en la energía de Dirichlet. Por lo tanto, proporcionamos un modelo profundo de GNN que resuelve el problema común de GNN de sobresuavizado. Las GNN que usan ACMP logran un rendimiento de vanguardia en tareas de clasificación de nodos del mundo real en conjuntos de datos tanto homogéneos como heterogéneos. El código se puede encontrar en https://github.com/ykiiiiii/ACMP .
Demostramos que el paso de mensajes de Allen-Cahn (ACMP) puede aumentar drásticamente la profundidad de las GNN, solucionando así el problema de suavizado excesivo.
◦
Lograr un rendimiento de última generación en tareas de clasificación de nodos del mundo real basado en una implementación simple y una justificación teórica.
◦
Demostración teórica de un límite inferior estrictamente positivo para la energía de Dirichlet.
•
Limitations:
◦
Se necesita un análisis más profundo del costo computacional y la escalabilidad del método propuesto.
◦
Se necesitan experimentos adicionales para determinar el rendimiento de generalización para diferentes estructuras de gráficos y tareas.
◦
Existe la posibilidad de sesgo hacia ciertos tipos de datos gráficos.