Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Red de interés de sinergia multimodal basada en difusión para la predicción de la tasa de clics

Created by
  • Haebom

Autor

Xiaoxi Cui, Weihai Lu, Yu Tong, Yiheng Li, Zhejun Zhao

Describir

Este artículo señala las limitaciones de los métodos actuales de predicción de la tasa de clics (CTR), que se basan principalmente en la modalidad de identificación y, por lo tanto, no logran modelar exhaustivamente las diversas preferencias de los usuarios. Proponemos un nuevo marco para la predicción multimodal de CTR: la Red de Interés de Sinergia Multimodal Basada en Difusión (Diff-MSIN). Diff-MSIN consta de tres módulos: el módulo de Mejora de Características Multimodales (MFE), el módulo de Captura de Relaciones Sinérgicas (SRC) y el módulo de Fusión Adaptativa Dinámica de Características (FDAF). Cada módulo se centra en extraer sinergias, puntos en común y características distintivas entre diversas modalidades, capturar las preferencias de los usuarios y reducir el ruido de fusión. Los resultados experimentales con Rec-Tmall y tres conjuntos de datos de Amazon muestran que Diff-MSIN supera a los métodos existentes en al menos un 1,67 %.

Takeaways, Limitations

Takeaways:
Proponemos un nuevo marco de predicción de CTR que utiliza información multimodal para modelar con mayor precisión las diversas preferencias de los usuarios.
Proponemos un nuevo método para superar las limitaciones de los métodos de fusión multimodal existentes y modelar eficazmente los efectos sinérgicos entre modalidades.
Demostramos experimentalmente que el método propuesto supera a los métodos existentes en varios conjuntos de datos.
La reproducibilidad fue garantizada mediante código público.
Limitations:
La mejora del rendimiento del método propuesto puede limitarse a conjuntos de datos específicos.
Se necesitan experimentos adicionales que utilicen conjuntos de datos más diversos y grandes.
Falta análisis sobre la complejidad computacional y la eficiencia del marco propuesto.
👍