Este artículo presenta FGBench, un novedoso conjunto de datos que contiene 625.000 problemas de inferencia de características moleculares, cuyo objetivo es mejorar el rendimiento de los modelos de lenguaje a gran escala (LLM) aprovechando la información de grupos funcionales (GF) en química. FGBench anota y localiza con precisión los grupos funcionales dentro de las moléculas, reforzando la conexión entre las estructuras moleculares y las descripciones textuales, y facilitando el desarrollo de LLM más interpretables y con mayor capacidad de análisis estructural. Abarca tareas de regresión y clasificación para 245 grupos funcionales diferentes en tres categorías (influencia de un solo grupo funcional, interacciones de grupos multifuncionales y comparaciones moleculares directas). Los resultados de referencia de los LLM de vanguardia demuestran que los LLM actuales presentan dificultades con la inferencia de características a nivel de grupo funcional. Se espera que la metodología FGBench sirva de base para generar nuevos pares de preguntas y respuestas con información a nivel de grupo funcional, lo que permitirá a los LLM comprender mejor las relaciones detalladas entre la estructura molecular y las propiedades. El conjunto de datos y el código de evaluación están disponibles públicamente en GitHub.