Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

InfMasking: Liberación de información sinérgica mediante interacciones multimodales contrastivas

Created by
  • Haebom

Autor

Liangjian Wen, Qun Dai, Jianzhuang Liu, Jiangtao Zheng, Yong Dai, Dongkai Wang, Zhao Kang, Jun Wang, Zenglin Xu, Jiang Duan

InfMasking: Extracción de información sinérgica contrastiva para el aprendizaje de representaciones multimodales

Describir

Este artículo propone InfMasking, un enfoque novedoso para capturar eficazmente las sinergias entre modalidades en el aprendizaje de representaciones multimodales. InfMasking utiliza una estrategia de enmascaramiento infinito para enmascarar aleatoriamente la mayoría de las características de cada modalidad, reteniendo solo información parcial para generar representaciones con diversos patrones de sinergia. La representación fusionada sin enmascarar se alinea con la representación enmascarada mediante la maximización de la información mutua, codificando información completa sobre sinergias. Este método expone el modelo a diversas combinaciones de modalidades parciales durante el entrenamiento, lo que permite capturar interacciones ricas. Para abordar la complejidad computacional, derivamos la pérdida de InfMasking para aproximar la estimación de la información mutua. Experimentos con conjuntos de datos reales a gran escala demuestran que InfMasking alcanza un rendimiento de vanguardia en siete pruebas de referencia.

Takeaways, Limitations

Takeaways:
Destacamos la importancia de la información sinérgica en el aprendizaje de la representación multimodal y proponemos una nueva metodología para capturarla de manera efectiva.
Permite el aprendizaje de varios patrones de sinergia a través de infinitas estrategias de enmascaramiento.
Desarrollo de InfMasking pérdida considerando eficiencia computacional.
Lograr un rendimiento de última generación en diversos conjuntos de datos del mundo real.
Limitations:
Se necesita más investigación sobre los antecedentes teóricos y el análisis de validez numérica específica de la estrategia de enmascaramiento infinito.
Se necesitan más investigaciones sobre la precisión y estabilidad de los cálculos aproximados de la pérdida de InfMasking.
Se requiere una revisión de escalabilidad para diversas combinaciones de modalidades y patrones de interacción complejos.
👍