Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

HiTeC: Aprendizaje contrastivo jerárquico en hipergrafos atribuidos a texto con aumento consciente de la semántica

Created by
  • Haebom

Autor

Mengting Pan, Fan Li, Xiaoyang Wang, Wenjie Zhang, Xuemin Lin

Describir

Este artículo propone HiTeC, un nuevo marco para el aprendizaje autosupervisado en hipergrafos atribuidos a texto (TAHG). Destacamos las limitaciones de los métodos existentes basados en el aprendizaje contrastivo, que no utilizan eficazmente la información textual en los TAHG, presentan ruido debido al aumento aleatorio de datos y presentan dificultades para capturar dependencias de largo alcance. HiTeC consta de una etapa de preentrenamiento del codificador de texto que utiliza una función objetivo contrastiva con reconocimiento de estructura, seguida de una segunda etapa que utiliza estrategias de aumento con reconocimiento de semántica, como el aumento de texto mejorado con indicaciones y la eliminación de hiperbordes con reconocimiento de semántica. Además, proponemos una función de pérdida contrastiva multiescala que captura mejor las dependencias de largo alcance mediante la contrastividad a nivel de subgrafo basada en s-walk. Este diseño en dos etapas desacopla el preentrenamiento del codificador de texto del aprendizaje contrastivo de hipergrafos, mejorando así la escalabilidad y manteniendo la calidad de la representación. Demostramos la eficacia de HiTeC mediante experimentos exhaustivos.

Takeaways, Limitations

Takeaways:
Presentamos HiTeC, un marco novedoso, eficiente y escalable para el aprendizaje autosupervisado en hipergrafos con propiedades textuales.
Superar las limitaciones de los métodos existentes a través del aprendizaje contrastivo consciente de la estructura y estrategias de aumento de la conciencia semántica.
Captura efectiva de dependencias de largo alcance con funciones de pérdida contrastivas de múltiples escalas.
Escalabilidad mejorada al separar el preentrenamiento del codificador de texto y el aprendizaje contrastivo del hipergrafo a través de un diseño de dos etapas.
Limitations:
Es posible que las mejoras de rendimiento de HiTeC se limiten a ciertos tipos de TAHG.
Se necesita más investigación para optimizar los parámetros de la estrategia de aumento de reconocimiento semántico propuesta.
La complejidad computacional de las funciones de pérdida contrastiva de múltiples escalas puede ser alta.
Se necesita una mayor validación de la aplicabilidad y el rendimiento de generalización en conjuntos de datos a gran escala del mundo real.
👍