Cet article présente les résultats d'une évaluation de 11 modèles linguistiques à grande échelle (MLH) open source visant à améliorer le système allemand d'enregistrement manuel des tumeurs. Des LMH comportant de 1 à 70 milliards de paramètres ont été utilisés pour évaluer leurs performances sur trois tâches fondamentales : l'identification du diagnostic tumoral, l'attribution du code CIM-10 et l'extraction de la date du premier diagnostic. À l'aide d'un ensemble de données annotées générées à partir de notes d'urologues anonymisées, les performances des modèles ont été analysées à l'aide de plusieurs stratégies d'incitation. Les modèles Llama 3.1 8B, Mistral 7B et Mistral NeMo 12B ont obtenu les meilleurs résultats, tandis que les modèles comportant moins de 7 milliards de paramètres ont affiché des performances significativement inférieures. L'incitation à l'aide de données issues de domaines médicaux non urologiques a significativement amélioré les performances, suggérant que les LMH open source présentent un potentiel important pour l'automatisation de l'enregistrement des tumeurs. Nous concluons que les modèles comportant de 7 à 12 milliards de paramètres offrent un équilibre optimal entre performances et efficacité des ressources. Le code d'évaluation et l'ensemble de données sont accessibles au public.