Este artículo utiliza datos históricos del recuento de medallas olímpicas para explorar la estructura de conocimiento interno de un modelo de lenguaje a gran escala (LLM). Evaluamos el rendimiento del LLM en dos tareas: recuperar el número de medallas de un país determinado y determinar la clasificación de cada país. Observamos que, si bien los LLM de vanguardia destacan en la recuperación de medallas, presentan dificultades en la clasificación. Este hallazgo pone de manifiesto la discrepancia entre la organización del conocimiento del LLM y el razonamiento humano, lo que pone de manifiesto las limitaciones en la integración del conocimiento interno del LLM. Para facilitar la investigación, hemos puesto a disposición del público el código, el conjunto de datos y la salida del modelo.