Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

REMOTO: Un marco unificado de extracción de relaciones multimodales con transporte óptimo multinivel y mezcla de expertos

Created by
  • Haebom

Autor

Xinkui Lin, Yongxiu Xu, Minghao Tang, Shilong Zhang, Hongbo Xu, Hao Xu, Yubin Wang

Describir

Este artículo propone REMOTE, un novedoso marco unificado para la extracción de relaciones multimodales (MRE). REMOTE extrae simultáneamente relaciones intramodales e intermodales entre entidades de texto y objetos visuales mediante el uso del transporte óptimo multinivel y una combinación de expertos. Supera la extracción de una sola relación y la duplicación computacional inherente a los métodos existentes, y selecciona dinámicamente las características de interacción óptimas para diversos tripletes de relaciones mediante un mecanismo de combinación de expertos. Además, introduce un módulo de fusión de transporte óptimo multinivel que conserva las ventajas de la codificación multicapa sin perder información de bajo nivel, generando representaciones más expresivas. Evaluamos la eficacia de REMOTE en un nuevo conjunto de datos, UMRE, y logramos un rendimiento de vanguardia en los conjuntos de datos MRE existentes. El código fuente está disponible en GitHub.

Takeaways, Limitations

Takeaways:
Presentamos un marco integrado para extraer simultáneamente varios tipos de tripletes de relaciones.
Extracción de relaciones eficiente y expresiva a través de propagación óptima de múltiples capas y mecanismos de mezcla expertos.
Evaluación y comparación objetiva del desempeño mediante la construcción del conjunto de datos UMRE.
Lograr un rendimiento de vanguardia y activar la investigación mediante la divulgación de código abierto
Limitations:
El tamaño y la diversidad del conjunto de datos UMRE podrían mejorarse en el futuro.
Puede haber diferencias de rendimiento para ciertos tipos de relaciones.
La complejidad computacional de los módulos de transmisión óptima multicapa puede ser alta.
👍