Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Time2time: Intervención causal en estados ocultos para simular eventos raros en modelos de series temporales

Created by
  • Haebom

Autor

Debdeep Sanyal, Aaryan Nagpal, Dhruv Kumar, Murari Mandal, Saurabh Deshpande

Describir

Si bien los modelos basados ​​en transformadores son excelentes para predecir patrones cotidianos, persisten las dudas sobre si internalizan conceptos semánticos, como las condiciones del mercado, o simplemente se ajustan a curvas. Además, surgen dudas sobre si estas representaciones internas pueden aprovecharse para simular eventos inusuales y riesgosos, como las caídas del mercado. Para abordar estas cuestiones, este artículo presenta una técnica de intervención causal denominada trasplante de activación. Esta técnica manipula el estado oculto aplicando momentos estadísticos de un evento (p. ej., una caída anterior) a otro evento (p. ej., un período de calma) durante un pase hacia adelante. Este procedimiento controla determinísticamente la predicción: la inyección de semántica de caída induce una predicción a la baja, mientras que la inyección de semántica de calma suprime la caída y restaura la estabilidad. Más allá del control binario, observamos que el modelo codifica una noción de severidad del evento y que la norma del vector latente está directamente correlacionada con la magnitud del shock del sistema. Validada en dos arquitecturas (Toto y Chronos), la técnica demuestra que las representaciones manipulables y semánticamente informadas son propiedades poderosas para los transformadores de series de tiempo a gran escala.

Takeaways, Limitations

Takeaways:
Demostramos que el modelo puede internalizar conceptos semánticos como las condiciones del mercado y manipularlos para controlar las predicciones.
Permite el análisis de "qué pasaría si" a través de técnicas de trasplante de activación, que pueden utilizarse para pruebas de estrés estratégicas.
Transformar la interpretabilidad de las representaciones internas del modelo desde la atribución post hoc a la intervención causal directa.
La robustez de los resultados está asegurada mediante la validación en dos arquitecturas diferentes (Toto, Chronos).
Limitations:
El documento no presenta explícitamente información específica Limitations (pero sí proporciona información general Limitations: complejidad del modelo, dependencia de los datos, generalización a mercados específicos, etc.)
👍