Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

LATTE: Aprendizaje de transacciones alineadas e incrustaciones textuales para clientes bancarios

Created by
  • Haebom

Autor

Egor Fadeev, Dzhambulat Mollaev, Aleksei Shestov, Dima Korolev, Omar Zoloev, Ivan Kireev, Andrey Savchenko, Maksim Makarenko

Describir

Este artículo propone LATTE, un nuevo marco para el aprendizaje de incrustaciones de clientes en aplicaciones financieras. Los modelos de lenguaje a gran escala (LLM) existentes presentan una sobrecarga computacional al procesar secuencias de eventos a largo plazo y son difíciles de aplicar a procesos del mundo real. LATTE es un marco de aprendizaje contrastivo que alinea las incrustaciones de eventos sin procesar con las incrustaciones semánticas extraídas de LLM congelados. Resume las características de las acciones en indicaciones breves, las incrusta mediante LLM y realiza aprendizaje supervisado mediante pérdida contrastiva. Esto reduce significativamente los costos de inferencia y el tamaño de la entrada en comparación con el procesamiento de secuencia completa mediante LLM. Los resultados experimentales con conjuntos de datos financieros del mundo real demuestran que LATTE supera a las técnicas de vanguardia existentes y es implementable incluso en entornos sensibles a la latencia.

Takeaways, Limitations

Takeaways:
Presentamos un novedoso método de aprendizaje integrado de clientes para aplicaciones financieras que aborda de manera eficaz los problemas de latencia y costos computacionales al tiempo que aprovecha el LLM.
Rendimiento validado sobre técnicas de última generación existentes en conjuntos de datos financieros del mundo real.
Proporciona un modelo práctico que se puede implementar incluso en entornos sensibles a la latencia.
Limitations:
El rendimiento del modelo propuesto puede estar limitado a conjuntos de datos financieros específicos.
Puede depender del rendimiento del LLM utilizado.
El rendimiento puede verse afectado por la calidad de la ingeniería rápida.
Se necesita más investigación sobre el rendimiento de la generalización en diferentes tipos de eventos financieros.
👍