Cet article présente FGBench, un nouvel ensemble de données contenant 625 000 problèmes d'inférence de caractéristiques moléculaires, visant à améliorer les performances des modèles de langage à grande échelle (MLL) exploitant les informations sur les groupes fonctionnels (GF) en chimie. FGBench annote et localise avec précision les groupes fonctionnels au sein des molécules, renforçant ainsi le lien entre les structures moléculaires et les descriptions textuelles, et facilitant le développement de LLM plus interprétables et plus sensibles à la structure. Il englobe des tâches de régression et de classification pour 245 groupes fonctionnels différents répartis en trois catégories (influence d'un groupe fonctionnel unique, interactions entre groupes multifonctionnels et comparaisons moléculaires directes). Les résultats de référence des LLM de pointe démontrent que les LLM actuels peinent à inférer des caractéristiques au niveau des groupes fonctionnels. La méthodologie FGBench devrait servir de base à la génération de nouvelles paires question-réponse avec des informations au niveau des groupes fonctionnels, permettant aux LLM de mieux comprendre les relations fines entre structure et propriété moléculaires. L'ensemble de données et le code d'évaluation sont accessibles au public sur GitHub.