Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Vinculación de la dinámica de paso hacia adelante en Transformers y el procesamiento humano en tiempo real

Created by
  • Haebom

Autor

Jennifer Hu, Michael A. Lepori, Michael Franke

Describir

En este artículo, investigamos si la dinámica de capa-tiempo de los modelos Transformer pre-entrenados proporciona poder predictivo adicional más allá de la distribución de probabilidad de salida del modelo para predecir el procesamiento humano en tiempo real a través de cinco estudios. Yendo más allá de los enfoques existentes que predicen medidas cognitivas humanas, como juicios fuera de línea o procesamiento en tiempo real, a partir de las salidas del modelo, exploramos la similitud de las estrategias de procesamiento entre humanos y modelos mediante el análisis del procesamiento interno de los propios modelos. Nuestros resultados en todos los dominios y modalidades demuestran que la dinámica de capa-tiempo de los modelos Transformer predice mejor el procesamiento humano, lo que sugiere que el procesamiento de Transformers entrenados para propósitos generales (p. ej., predecir el siguiente token, reconocer imágenes) puede ser facilitado o dificultado por características similares del procesamiento humano. Esto sugiere una nueva forma de usar los modelos de IA como modelos de procesamiento explícito, en lugar de simples mapeos de estímulo-respuesta.

Takeaways, Limitations

Takeaways:
Demostramos que la dinámica temporal capa por capa en un modelo Transformer proporciona un mayor poder predictivo que el uso de la salida del modelo únicamente para predecir el procesamiento humano en tiempo real.
Presentamos un nuevo enfoque para el uso de modelos de IA en el estudio de la cognición humana. Al analizar el procesamiento interno del modelo, así como su resultado, podemos profundizar nuestra comprensión de la cognición humana.
Esto sugiere que un procesamiento similar al humano puede surgir naturalmente en modelos de IA entrenados a través de funciones objetivas generales.
Limitations:
Los resultados pueden variar según las características del modelo Transformer utilizado en el estudio (estructura, tamaño, datos de entrenamiento, etc.). Se requiere mayor investigación sobre diversos modelos.
Existen desafíos para medir con precisión el procesamiento humano en tiempo real, lo que puede afectar la interpretación de los resultados de la investigación.
La investigación actual se limita a un tipo específico de modelo de IA (Transformer) y se necesita más investigación para determinar si se puede aplicar a otros tipos de modelos.
Se necesitan más investigaciones para dilucidar la relación precisa entre los procesos cognitivos humanos y la dinámica temporal jerárquica del modelo.
👍