V-Droid es un agente de automatización de tareas con interfaz gráfica de usuario (GUI) móvil. A diferencia de los LLM tradicionales, que generan acciones directamente para cada paso, V-Droid utiliza LLM como verificador para evaluar las acciones candidatas. Para lograrlo, presentamos un marco integral que incluye un flujo de trabajo dedicado para crear y precargar un espacio de acción discretizado, aprendizaje interactivo de preferencias de progreso y un esquema escalable de anotación conjunta entre agentes y humanos. En múltiples pruebas de referencia de automatización de tareas móviles, como AndroidWorld, AndroidLab y MobileAgentBench, V-Droid alcanza tasas de éxito más altas (59,5 %, 38,3 % y 49 %, respectivamente) y una velocidad de procesamiento significativamente mayor (4,3 segundos por paso, 6,1 veces más rápido que los agentes existentes). El código fuente está disponible en GitHub.