Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Atténuation des hallucinations dans les modèles de détection d'objets basés sur YOLO : un retour sur la détection hors distribution

Created by
  • Haebom

Auteur

Weicheng He, Changshun Wu, Chih-Hong Cheng, Xiaowei Huang, Saddek Bensalem

Contour

Dans cet article, nous étudions la technique de filtrage de détection hors distribution (OoD) du détecteur d'objets de la série YOLO afin de réduire les hallucinations dues à un excès de confiance pour une prise de décision sûre dans des environnements dynamiques tels que la conduite autonome. Nous soulignons l'inexactitude des évaluations de référence OoD existantes et révélons que les jeux de données OoD existants contiennent environ 13 % d'objets ID (en distribution), et que l'inclusion d'objets OoD dans les jeux de données ID affecte négativement la limite de décision. Pour résoudre ces problèmes, nous utilisons un pipeline intégrant détecteurs et filtres d'objets, et proposons une technique d'optimisation fine qui génère des jeux de données OoD sémantiquement similaires à la cible de détection et supprime les scores d'objets du détecteur YOLO qui les utilise. Nous obtenons un résultat de réduction de l'erreur d'hallucination totale de 88 % sur le test de référence de conduite autonome BDD-100K. Nous présentons le code et le jeu de données améliorés.

Takeaways, Limitations

Takeaways:
Nous révélons les erreurs dans les évaluations de référence OoD existantes et proposons une méthode d’évaluation plus précise.
Nous proposons une nouvelle méthodologie pour optimiser de manière exhaustive les détecteurs et filtres d'objets.
Nous démontrons un moyen efficace d'améliorer les performances des détecteurs de la famille YOLO en générant des ensembles de données OoD sémantiquement similaires.
Nous obtenons une amélioration remarquable des performances sur BDD-100K, réduisant les erreurs d'hallucination de 88 %.
Augmentez la reproductibilité de vos recherches en rendant publics votre code amélioré et vos ensembles de données.
Limitations:
La méthodologie présentée est spécialisée pour les détecteurs de la famille YOLO et peut avoir une applicabilité limitée à d'autres détecteurs d'objets.
Une validation supplémentaire des performances de généralisation de l’ensemble de données OoD généré est nécessaire.
Les résultats de l’évaluation des performances dans un environnement de conduite autonome réel n’ont pas été présentés.
ÉTant donné que les résultats sont limités à BDD-100K, les performances de généralisation sur d’autres ensembles de données nécessitent une étude plus approfondie.
👍