Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
QuRe : Récupération pertinente pour les requêtes grâce à l'échantillonnage négatif dur dans la récupération d'images composées
Created by
Haebom
Auteur
Jaehyun Kwak, Ramahdani Muhammad Izaaz Inhar, Se-Young Yun, Sung-Ju Lee
Contour
Cet article aborde le problème de la recherche d'images de synthèse (RIS), qui récupère des images pertinentes à partir d'une image de référence et d'un texte décrivant la modification souhaitée. Les méthodes RIS existantes présentent la limite de se concentrer uniquement sur la recherche de l'image cible et d'ignorer la pertinence des autres images. En effet, la plupart des méthodes utilisant l'apprentissage contrastif traitent l'image cible comme positive et toutes les autres images du lot comme négatives, ce qui peut inclure des faux négatifs. Dans cet article, nous proposons la méthode QuRe (Retrieval pertinent par échantillonnage négatif dur), qui optimise la fonction objective du modèle de récompense afin de réduire les faux négatifs. De plus, nous introduisons une stratégie d'échantillonnage négatif dur qui sélectionne les images situées entre deux chutes brutales des scores de pertinence après l'image cible, filtrant ainsi efficacement les faux négatifs. Pour évaluer l'adéquation avec les préférences humaines, nous créons un nouvel ensemble de données, Human-Preference FashionIQ (HP-FashionIQ), qui capture explicitement les préférences des utilisateurs au-delà de la recherche de la cible. Les résultats expérimentaux montrent que QuRe atteint des performances de pointe sur les jeux de données FashionIQ et CIRR, et qu'il correspond parfaitement aux préférences humaines sur le jeu de données HP-FashionIQ. Le code source est disponible à l' adresse https://github.com/jackwaky/QuRe .
Contribue à améliorer les performances du CIR et à augmenter la satisfaction des utilisateurs en résolvant le problème des faux négatifs.
◦
Filtrez efficacement les images non pertinentes grâce à une stratégie d'échantillonnage négatif strict.
◦
Présentation de HP-FashionIQ, un nouvel ensemble de données reflétant les préférences humaines.
◦
Atteindre des performances de pointe sur les ensembles de données FashionIQ et CIRR.
◦
Montre une forte adéquation avec les préférences humaines.
•
Limitations:
◦
Des recherches supplémentaires sont nécessaires sur l’échelle et les performances de généralisation de l’ensemble de données HP-FashionIQ.
◦
D’autres études sont nécessaires pour explorer l’applicabilité de la méthode proposée à d’autres problèmes CIR ou à d’autres modalités.
◦
Des recherches supplémentaires sont nécessaires sur la conception du modèle de compensation et l’optimisation de la stratégie d’échantillonnage négatif dur.