Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Revisiter la détection hors distribution dans la détection d'objets en temps réel : des pièges de référence à un nouveau paradigme d'atténuation

Created by
  • Haebom

Auteur

Changshun Wu, Weicheng He, Chih-Hong Cheng, Xiaowei Huang, Saddek Bensalem

Contour

Cet article soutient que la résolution du problème de confiance excessive des modèles de détection d'objets basés sur l'apprentissage profond sur des entrées hors distribution (OoD) nécessite une refonte complète du cycle de développement, au-delà des améliorations algorithmiques telles que l'amélioration de la fonction de notation existante et l'ajustement des seuils de temps de test. Nous mettons en évidence les erreurs (jusqu'à 13 % de contamination) des benchmarks d'évaluation de détection OoD existants et proposons un nouveau paradigme d'atténuation du temps d'apprentissage qui ajuste finement le détecteur à l'aide d'un ensemble de données OoD sémantiquement similaire, sans dépendre de détecteurs OoD externes. Cette approche réduit les erreurs d'hallucination de 91 % dans l'environnement BDD-100K pour le modèle YOLO, et démontre sa généralisabilité à diverses méthodes de détection, notamment YOLO, Faster R-CNN et RT-DETR, ainsi qu'à l'adaptation par petits coups.

Takeaways, Limitations

Takeaways:
En révélant de graves problèmes de contamination des données dans les critères d’évaluation de détection OoD existants, nous soulevons des questions sur la fiabilité des résultats de recherche existants et soulignons la nécessité de critères d’évaluation plus rigoureux.
Nous présentons une nouvelle approche pour améliorer la résistance OoD du modèle lui-même en exploitant les données OoD pendant le temps de formation.
Une méthodologie générale est présentée qui peut être appliquée à divers modèles de détection d'objets tels que YOLO, Faster R-CNN et RT-DETR, et peut être adaptée même avec de petites quantités de données.
Nous démontrons des améliorations substantielles des performances, réduisant l’erreur d’hallucination du modèle YOLO de 91 % sur l’ensemble de données BDD-100K.
Limitations:
L'efficacité de la méthode proposée pourrait être limitée à des ensembles de données et modèles spécifiques. Des expériences supplémentaires sur divers ensembles de données et modèles sont nécessaires.
Une analyse plus approfondie est nécessaire sur le coût de calcul et la complexité de la préparation des données du nouveau paradigme de relaxation du temps de formation.
Le taux de contamination de 13 % s’applique à un point de référence spécifique, et une vérification supplémentaire est nécessaire pour déterminer s’il s’applique également à d’autres points de référence.
👍