[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

¿Es esto solo una fantasía? Las representaciones de modelos lingüísticos reflejan los juicios humanos sobre la plausibilidad de los eventos.

Created by
  • Haebom

Autor

Michael A. Lepori, Jennifer Hu, Ishita Dasgupta, Roma Patel, Thomas Serre, Ellie Pavlick

Describir

Este artículo investiga la capacidad de los modelos de lenguaje (LM) utilizados en diversas tareas para identificar categorías modales (como posibilidad, imposibilidad e ilogicidad) de oraciones. Si bien estudios previos han cuestionado la capacidad de los LM para clasificar categorías modales, este estudio identifica representaciones lineales (vectores de diferencia modal) que distinguen categorías modales dentro de varios LM. Los resultados del análisis muestran que los LM tienen capacidades de clasificación de categorías modales más confiables que estudios previos, y los vectores de diferencia modal aparecen en un orden consistente con la mejora del rendimiento del modelo (aumento de pasos de entrenamiento, capas y número de parámetros). Además, demostramos que los vectores de diferencia modal identificados dentro de las activaciones de LM pueden usarse para modelar comportamientos de categorización humana de granularidad fina, y esto puede proporcionar nuevos conocimientos sobre cómo los humanos distinguen categorías modales al correlacionar las proyecciones a lo largo de los vectores de diferencia modal con las calificaciones de los participantes humanos de las características interpretables. En conclusión, este estudio proporciona nuevos conocimientos sobre la categorización modal de LM utilizando técnicas de interpretabilidad de máquinas y puede contribuir a una mejor comprensión de la categorización modal humana.

Takeaways, Limitations

Takeaways:
Demostramos que nuestro modelo de lenguaje tiene una capacidad de clasificación de categorías modales más sofisticada que estudios anteriores.
Aclaramos la relación entre la mejora del rendimiento del modelo y el orden de aparición consistente de los vectores de diferencia modal.
Posibilidad de modelar el comportamiento de categorización humana utilizando vectores de diferencia modal dentro de activaciones LM.
Proporciona nuevos conocimientos sobre cómo los humanos distinguen las categorías modales.
Demostración de la utilidad del análisis LM utilizando técnicas de interpretabilidad mecánica.
Limitations:
El artículo no menciona ningún __T8652_____ específico. Se prevé que se requieran más investigaciones para verificar con mayor precisión el rendimiento de generalización del vector de diferencia modal, su aplicabilidad a diversos modelos y tareas lingüísticas, y la robustez de su correlación con el comportamiento de categorización humano.
👍