V-Droid est un agent d'automatisation de tâches basé sur une interface utilisateur graphique mobile. Contrairement aux LLM traditionnels qui génèrent directement des actions pour chaque étape, V-Droid utilise les LLM comme vérificateurs pour évaluer les actions candidates. Pour ce faire, nous présentons un framework complet comprenant un workflow dédié à la création et au pré-remplissage d'un espace d'action discrétisé, un apprentissage interactif des préférences de progression et un schéma d'annotation conjoint homme-agent évolutif. Sur plusieurs benchmarks d'automatisation de tâches mobiles, dont AndroidWorld, AndroidLab et MobileAgentBench, V-Droid obtient des taux de réussite plus élevés (59,5 %, 38,3 % et 49 %, respectivement) et une vitesse de traitement nettement supérieure (4,3 secondes par étape, soit 6,1 fois plus rapide que les agents existants). Le code source est disponible sur GitHub.