[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

TResNet amélioré pour la classification fine des images alimentaires

Created by
  • Haebom

Auteur

Lulu Liu, Zhiyong Xiao

Contour

Pour relever le défi de la classification fine des images alimentaires présentant des différences subtiles, cet article propose un nouveau TResNet à fonctionnalités améliorées (FE-TResNet), qui intègre les techniques Style-based Recalibration Module (StyleRM) et Deep Channel-wise Attention (DCA) au modèle TResNet. FE-TResNet atteint des précisions de classification de 81,37 % et 80,29 % sur les jeux de données d'images alimentaires chinoises ChineseFoodNet et CNFOOD-241, respectivement, surpassant les modèles CNN conventionnels. Considérant que les images alimentaires sont un support important pour transmettre le patrimoine culturel et les liens émotionnels, cela a des implications importantes dans divers domaines d'application.

Takeaways, Limitations

Takeaways:
Une nouvelle approche de la classification fine des images alimentaires
Améliorer les performances de TResNet en intégrant StyleRM et DCA
Obtenir une précision de classification élevée sur un ensemble de données d'images de produits alimentaires chinois
Suggère des applications potentielles dans divers domaines liés à l'alimentation
Limitations:
L’évaluation des performances de la méthode proposée est limitée à un ensemble de données alimentaires chinoises spécifiques.
Une vérification des performances de généralisation est nécessaire pour d’autres types d’images alimentaires ou des ensembles de données plus diversifiés.
Des recherches supplémentaires sont nécessaires sur l'optimisation des paramètres de StyleRM et DCA
Une analyse plus approfondie des performances et de l’efficacité dans des environnements d’application réels est nécessaire.
👍