Cet article aborde le problème de la génération de rapports de tomodensitométrie (CTRG), qui génère automatiquement des rapports de diagnostic à partir d'images 3D afin de réduire la charge de travail du personnel médical et d'améliorer la prise en charge des patients. Pour pallier les limites des études précédentes, qui ne parviennent pas à intégrer efficacement les informations diagnostiques issues de différentes vues anatomiques et manquent de l'expertise clinique essentielle à un diagnostic précis et fiable, nous proposons un nouveau modèle de transformateur d'amélioration des connaissances multi-vues (MvKeTR) qui imite le processus diagnostique du personnel médical. MvKeTR se compose d'un agrégateur multi-vues (MVPA) avec attention sensible à la vue qui intègre efficacement les informations diagnostiques issues de plusieurs vues anatomiques (axiale, coronale, sagittale) et d'un amplificateur de connaissances intermodal (CMKE) qui récupère des rapports similaires et intègre les connaissances du domaine au processus diagnostique. De plus, au lieu du MLP conventionnel, nous utilisons des réseaux de Kolmogorov-Arnold (KAN) à haute efficacité paramétrique et à biais spectral réduit pour capturer efficacement les composantes haute fréquence et atténuer le surapprentissage. Grâce à des expériences approfondies sur l'ensemble de données public CTRG-Chest-548 K, nous démontrons que la méthode proposée surpasse les modèles de pointe existants pour la plupart des indicateurs. Le code source est disponible sur GitHub.