Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Mejora de la sensibilidad temporal de un modelo de lenguaje extenso para la recomendación mediante ajuste contrafáctico

Created by
  • Haebom

Autor

Yutian Liu, Zhengyi Yang, Jiancan Wu, Xiang Wang

Describir

Este artículo analiza las tendencias de investigación recientes en la aplicación de modelos de lenguaje a gran escala (LLM) a la recomendación secuencial. Los métodos existentes basados ​​en LLM no utilizan por completo la rica información temporal inherente a las secuencias de interacción pasadas de un usuario. Esto se debe a que el mecanismo de autoatención de LLM carece inherentemente de información de secuencia y se basa en incrustaciones posicionales, que son menos adecuadas para las secuencias de interacción del usuario que el lenguaje natural. Para abordar estas limitaciones, proponemos un Marco temporal mejorado contrafactual para la recomendación basada en LLM (CETRec) , que separa y mide la influencia de la información temporal basada en principios de inferencia causal . CETRec mejora eficazmente la comprensión de LLM tanto del orden absoluto (tiempos de interacción con los elementos) como del orden relativo (relaciones secuenciales entre los elementos) mediante el uso de ajustes contrafactuales derivados del análisis causal. Demostramos la eficacia de CETRec a través de experimentos extensos en conjuntos de datos del mundo real.

Takeaways, Limitations

Takeaways:
Un nuevo enfoque para mejorar el rendimiento de los sistemas de recomendación secuencial basados ​​en LLM.
Clarificar y aprovechar la importancia de la información temporal utilizando la inferencia causal.
Capture con precisión los cambios de preferencias del usuario considerando información de orden temporal tanto absoluta como relativa.
Validación de la eficacia mediante resultados experimentales utilizando conjuntos de datos reales
Limitations:
Es necesaria una verificación adicional del rendimiento de generalización del método propuesto.
Se necesitan estudios de aplicabilidad para otros tipos de sistemas de recomendación o conjuntos de datos.
Se necesita un análisis más profundo del coste computacional y la complejidad.
👍