Dans cet article, nous présentons NOVA, un framework entièrement embarqué et centré sur l'objet, qui utilise uniquement des caméras stéréo et une centrale inertielle (IMU) pour résoudre le problème du suivi de cibles pour les véhicules autonomes dans des environnements non structurés sans GPS. NOVA réalise la perception, l'estimation et le contrôle dans le référentiel de la cible, sans recourir à la génération de cartes globales ni à des informations de position absolue. Il combine un détecteur d'objets léger avec une complétion de profondeur stéréo et un filtrage par histogramme pour obtenir une estimation fiable de la distance de la cible, même en occlusion et dans des environnements bruyants. Ces mesures sont transmises à un estimateur d'état visuo-inertiel afin de reconstruire la pose à 6 degrés de liberté du robot par rapport à la cible. Un contrôleur prédictif de modèle non linéaire (NMPC) planifie dynamiquement une trajectoire exécutable dans le référentiel cible, et des fonctions de barrière de contrôle d'ordre élevé permettent d'éviter les obstacles en temps réel sans cartes ni représentations denses. La robustesse et la fiabilité du cadre proposé sont vérifiées par des expériences dans divers environnements réels, notamment des labyrinthes urbains, des sentiers forestiers et des passages de bâtiments, et le suivi agile des cibles est réalisé à des vitesses supérieures à 50 km/h.