Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Aprendizaje de representación de elementos relacionales multimodales para inferir elementos sustituibles y complementarios

Created by
  • Haebom

Autor

Junting Wang, Chenghuan Guo, Jiao Yang, Yanhui Guo, Yan Gao, Hari Sundaram

Describir

Este artículo propone MMSC, un novedoso marco de aprendizaje de representación relacional multimodal de ítems basado en aprendizaje autosupervisado, diseñado para inferir ítems alternativos y complementarios. Los enfoques existentes se centran en modelar las asociaciones entre ítems inferidas a partir del comportamiento del usuario mediante redes neuronales globales (GNN) o aprovechando la información del contenido del ítem, pero tienden a ignorar los desafíos de la escasez de datos debido al ruido en los datos de comportamiento del usuario y a las distribuciones de cola larga. MMSC consta de un módulo de aprendizaje de representación de ítems multimodal que utiliza un modelo base multimodal, un módulo de aprendizaje de representación de acciones basado en aprendizaje autosupervisado que elimina el ruido y aprende de los datos de comportamiento del usuario, y un mecanismo de agregación de representación jerárquica que integra las representaciones de ítems tanto a nivel semántico como de tarea. Además, se utilizan LLM para generar datos de aprendizaje aumentados y optimizar el proceso de eliminación de ruido durante el entrenamiento. Experimentos exhaustivos en cinco conjuntos de datos del mundo real demuestran que MMSC supera a los modelos de referencia existentes en un 26,1 % en la recomendación alternativa y en un 39,2 % en la recomendación complementaria, lo que demuestra su eficacia en el modelado de elementos de inicio en frío.

Takeaways, Limitations

Takeaways:
Aborda eficazmente los problemas del comportamiento ruidoso de los usuarios y la escasez de datos combinando información multimodal y aprendizaje autosupervisado.
Mejora enormemente el rendimiento de la recomendación de artículos de reemplazo y complementarios.
Mejora el rendimiento de las recomendaciones para elementos de inicio en frío.
Presentamos un método novedoso para mejorar el rendimiento del modelo mediante el aumento de datos utilizando LLM.
Limitations:
Se necesitan más análisis para determinar la confiabilidad y el rendimiento de generalización del aumento de datos utilizando LLM.
Se requiere una evaluación del desempeño de generalización en varios tipos de datos multimodales.
Se requiere verificar el rendimiento y la eficiencia de las recomendaciones en tiempo real en entornos de servicio reales.
👍