Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Suivi d'objets visuels à long terme avec des caméras événementielles : un système de suivi à mémoire associative augmentée et un ensemble de données de référence

Created by
  • Haebom

Auteur

Xiao Wang, Xufeng Lou, Shiao Wang, Ju Huang, Lan Chen, Bo Jiang

Contour

Cet article aborde les limites de l'évaluation des outils de suivi existants basés sur des flux d'événements sur des jeux de données de suivi à court terme et présente FELT, un nouvel ensemble de données de suivi à long terme à grande échelle qui prend en compte le suivi à long terme dans des scénarios réels. FELT comprend 1 044 vidéos à long terme, 1,9 million de paires d'images RVB et de flux d'événements, 60 objets cibles différents et 14 attributs complexes. De plus, nous réentraînons et évaluons 21 outils de suivi de référence sur le jeu de données FELT afin d'établir une référence. Enfin, nous proposons AMTTrack, un outil de suivi visuel à long terme d'événements RVB basé sur l'Associative Memory Transformer (AMT). AMTTrack suit un cadre de suivi à flux unique, agrège efficacement les modèles RVB/événements multi-échelles et les jetons de recherche via une couche de recherche Hopfield, et maintient des représentations dynamiques des modèles via une méthode de mise à jour de la mémoire associative pour résoudre le problème des changements d'apparence dans le suivi à long terme. Nous validons l'efficacité du tracker proposé grâce à des expériences approfondies sur les jeux de données FELT, FE108, VisEvent et COESOT. Les jeux de données et le code source seront rendus publics.

Takeaways, Limitations

Takeaways:
Nous contribuons à l’avancement de la recherche sur le suivi à long terme en présentant FELT, un ensemble de données de suivi d’objets visuels à long terme à grande échelle qui prend en compte des scénarios du monde réel.
Nous proposons un nouvel algorithme de suivi à long terme, AMTTrack, qui utilise efficacement les informations d'événements RVB.
Validation de la supériorité d'AMTTrack sur divers ensembles de données.
Fournir une nouvelle référence en matière de suivi à long terme.
Limitations:
Un examen plus approfondi de la diversité et de la représentativité de l’ensemble de données FELT est nécessaire.
Une analyse plus approfondie du coût de calcul et des performances en temps réel d’AMTTrack est nécessaire.
Des études comparatives plus complètes avec d’autres algorithmes de suivi à long terme de pointe sont nécessaires.
👍