Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Agrupamiento escalable de gráficos con atributos faltantes mediante diferenciación de vecindad

Created by
  • Haebom

Autor

Yaowen Hu, Wenxuan Tu, Yue Liu, Xinhang Wan, Junyi Yan, Taichun Zhou, Xinwang Liu

Describir

Este artículo analiza la agrupación profunda de grafos (DGC), que clasifica de forma no supervisada los nodos de los grafos de atributos en múltiples clústeres. Para abordar los desafíos de los grafos de atributos del mundo real, que suelen ser grandes y carecer de atributos, proponemos un novedoso método de DGC: la "Diferenciación Complementaria de Vecinos Multivista (CMV-ND)". CMV-ND preprocesa la información estructural del grafo en múltiples perspectivas de forma completa y sin redundancia. Específicamente, expande completamente la estructura local del grafo mediante la búsqueda recursiva de vecinos y elimina la redundancia entre vecinos con diferentes distancias de salto mediante una estrategia de diferenciación de vecinos. Posteriormente, construye K+1 perspectivas complementarias a partir de representaciones de salto diferenciales y características del nodo objetivo, y aplica métodos existentes de agrupación multivista o DGC. Los resultados experimentales en seis conjuntos de datos de grafos ampliamente utilizados demuestran que CMV-ND mejora significativamente el rendimiento de varios métodos.

Takeaways, Limitations

Takeaways:
Presentamos un método DGC eficaz para gráficos del mundo real que sufren problemas de gran escala y de atributos faltantes.
Utiliza de manera eficiente y completa la información de la estructura del gráfico a través de estrategias recursivas de búsqueda y diferenciación de vecinos.
Proporciona un rendimiento mejorado a través de la compatibilidad con varios métodos DGC existentes.
Verificamos la superioridad del método propuesto a través de resultados experimentales.
Limitations:
Falta análisis de la complejidad computacional del método propuesto.
No se ha verificado suficientemente el rendimiento de generalización para varios tipos de estructuras gráficas.
Se requiere análisis de sensibilidad para configuraciones de parámetros específicos.
Existe un potencial de sesgo hacia ciertos tipos de patrones de omisión de atributos.
👍