Este artículo investiga la capacidad de los modelos de lenguaje (LM) utilizados en diversas tareas para identificar categorías modales (como posibilidad, imposibilidad e ilogicidad) de oraciones. Si bien estudios previos han cuestionado la capacidad de los LM para clasificar categorías modales, este estudio identifica representaciones lineales (vectores de diferencia modal) que distinguen categorías modales dentro de varios LM. Los resultados del análisis muestran que los LM tienen capacidades de clasificación de categorías modales más confiables que estudios previos, y los vectores de diferencia modal aparecen en un orden consistente con la mejora del rendimiento del modelo (aumento de pasos de entrenamiento, capas y número de parámetros). Además, demostramos que los vectores de diferencia modal identificados dentro de las activaciones de LM pueden usarse para modelar comportamientos de categorización humana de granularidad fina, y esto puede proporcionar nuevos conocimientos sobre cómo los humanos distinguen categorías modales al correlacionar las proyecciones a lo largo de los vectores de diferencia modal con las calificaciones de los participantes humanos de las características interpretables. En conclusión, este estudio proporciona nuevos conocimientos sobre la categorización modal de LM utilizando técnicas de interpretabilidad de máquinas y puede contribuir a una mejor comprensión de la categorización modal humana.