Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

TITAN : Apprentissage adaptatif et contradictoire basé sur des jetons de requête

Created by
  • Haebom

Auteur

Tajamul Ashraf, Janibul Bashir

Contour

Cet article se concentre sur le problème de la détection d'objets adaptative au domaine sans source (SF-DAOD), qui doit s'adapter au domaine cible sans données source. La plupart des approches existantes utilisent une approche auto-supervisée utilisant le cadre élève-enseignant (ST) qui affine les pseudo-étiquettes générées par le modèle source pré-entraîné. Cependant, le modèle enseignant s'effondre en raison du bruit important des pseudo-étiquettes causé par le biais de domaine, l'inadéquation et le décalage de domaine significatif, ce qui dégrade considérablement les performances du modèle élève. Pour résoudre ce problème, nous proposons dans cet article un réseau antagoniste itératif de jetons de requête basé sur la cible (TITAN). TITAN segmente l'image cible en échantillons similaires à la source (faciles) et en échantillons différents à la source (difficiles), et utilise une stratégie pour estimer la variance en exploitant l'idée qu'une variance de détection plus élevée conduit à un meilleur rappel et à une plus grande similarité avec le domaine source. De plus, nous intégrons un module antagoniste basé sur des jetons de requête au cadre élève-enseignant afin de réduire l'écart de domaine entre les deux représentations de caractéristiques. Des expériences sur quatre jeux de données d'images naturelles et deux jeux de données médicales montrent que TITAN surpasse les méthodes de pointe existantes (SOTA). Nous rapportons des améliorations de mAP de +22,7 %, +22,2 %, +21,1 % et +3,7 % respectivement sur les benchmarks C2F, C2B, S2C et K2C.

Takeaways, Limitations_

Takeaways:
Nous présentons TITAN, une nouvelle approche du problème de détection d'objets adaptatifs au domaine sans source.
Nous proposons une stratégie pour atténuer efficacement le problème du bruit des étiquettes des médecins.
Amélioration des performances grâce à la segmentation des images du domaine cible et à l'estimation de la variance.
Atteindre les performances SOTA sur divers ensembles de données.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la stratégie d’estimation de la variance de TITAN.
Les améliorations de performances pour un ensemble de données particulier peuvent ne pas être généralisées à d’autres ensembles de données.
Une vérification de l’applicabilité pour des domaines plus divers et plus complexes est nécessaire.
👍