Cet article examine la capacité des modèles de langage (ML) utilisés dans diverses tâches à identifier les catégories modales (telles que la possibilité, l'impossibilité et l'illogisme) des phrases. Alors que des études antérieures ont remis en question la capacité des ML à classer les catégories modales, cette étude identifie des représentations linéaires (vecteurs de différence modale) qui distinguent les catégories modales au sein de divers ML. Les résultats de l'analyse montrent que les ML présentent des capacités de classification des catégories modales plus fiables que les études précédentes, et que les vecteurs de différence modale apparaissent dans un ordre cohérent avec l'amélioration des performances du modèle (augmentation du nombre d'étapes d'apprentissage, des couches et du nombre de paramètres). De plus, nous démontrons que les vecteurs de différence modale identifiés dans les activations des ML peuvent être utilisés pour modéliser finement les comportements de catégorisation humaine, ce qui peut apporter de nouvelles perspectives sur la façon dont les humains distinguent les catégories modales en corrélant les projections le long des vecteurs de différence modale avec les évaluations des participants humains des caractéristiques interprétables. En conclusion, cette étude fournit de nouvelles perspectives sur la catégorisation modale des LM à l’aide de techniques d’interprétabilité des machines et peut contribuer à une meilleure compréhension de la catégorisation modale humaine.