Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

MvKeTR : Génération de rapports de tomodensitométrie thoracique avec perception multi-vues et amélioration des connaissances

Created by
  • Haebom

Auteur

Xiwei Deng, Xianchun He, Jianfeng Bao, Yudan Zhou, Shuhui Cai, Congbo Cai, Zhong Chen

Contour

Cet article aborde le problème de la génération de rapports de tomodensitométrie (CTRG), qui génère automatiquement des rapports de diagnostic à partir d'images 3D afin de réduire la charge de travail du personnel médical et d'améliorer la prise en charge des patients. Pour pallier les limites des études précédentes, qui ne parviennent pas à intégrer efficacement les informations diagnostiques issues de différentes vues anatomiques et manquent de l'expertise clinique essentielle à un diagnostic précis et fiable, nous proposons un nouveau modèle de transformateur d'amélioration des connaissances multi-vues (MvKeTR) qui imite le processus diagnostique du personnel médical. MvKeTR se compose d'un agrégateur multi-vues (MVPA) avec attention sensible à la vue qui intègre efficacement les informations diagnostiques issues de plusieurs vues anatomiques (axiale, coronale, sagittale) et d'un amplificateur de connaissances intermodal (CMKE) qui récupère des rapports similaires et intègre les connaissances du domaine au processus diagnostique. De plus, au lieu du MLP conventionnel, nous utilisons des réseaux de Kolmogorov-Arnold (KAN) à haute efficacité paramétrique et à biais spectral réduit pour capturer efficacement les composantes haute fréquence et atténuer le surapprentissage. Grâce à des expériences approfondies sur l'ensemble de données public CTRG-Chest-548 K, nous démontrons que la méthode proposée surpasse les modèles de pointe existants pour la plupart des indicateurs. Le code source est disponible sur GitHub.

Takeaways, Limitations

Takeaways:
Amélioration des performances de génération de rapports CT en intégrant des informations multi-vues et en exploitant les connaissances cliniques.
Résolution des problèmes d'efficacité des paramètres et de surajustement en exploitant les KAN.
Obtenez des résultats qui surpassent les performances des modèles de pointe existants.
Assurer la reproductibilité et l'extensibilité grâce au code open source.
Limitations:
Seules les évaluations de performances pour un ensemble de données spécifique (CTRG-Chest-548 K) sont présentées, une vérification des performances de généralisation est donc nécessaire.
Une validation supplémentaire et une assurance de sécurité sont nécessaires pour l’application sur le terrain clinique.
Des études d’applicabilité à d’autres modalités (par exemple, IRM, TEP) sont nécessaires.
👍