Cet article présente WebProber, un framework de tests web basé sur des modèles de langage à grande échelle (LLM) et des agents d'IA, permettant d'identifier efficacement les problèmes d'utilisabilité des sites web. Contrairement aux approches existantes axées sur la couverture de code et les tests de charge, WebProber navigue et interagit avec les sites web de manière similaire à celle des utilisateurs réels, identifiant les bugs et les problèmes d'utilisabilité et générant des rapports compréhensibles par l'utilisateur. Dans une étude de cas portant sur 120 sites web universitaires, WebProber a identifié 29 problèmes d'utilisabilité que les outils existants n'avaient pas détectés. Cela démontre le potentiel des tests basés sur des agents d'IA et suggère des pistes pour le développement de frameworks de tests nouvelle génération centrés sur l'utilisateur.