Este artículo presenta un estudio que aplica técnicas de sondeo de estados para evaluar la capacidad de los modelos de lenguaje a gran escala (LLM) para comprender el proceso de cocción. Los LLM se entrenan con grandes cantidades de texto procedimental, pero debido a su falta de observación directa de fenómenos del mundo real, tienen dificultades para comprender con precisión los pasos intermedios en las recetas de cocina. Para abordar esto, construimos un novedoso conjunto de datos de recetas japonesas con anotaciones claras y precisas de los cambios en el estado de los ingredientes. Con base en este conjunto de datos, presentamos tres nuevas tareas para evaluar la capacidad de los LLM para rastrear los cambios en el estado de los ingredientes durante el proceso de cocción e identificar los ingredientes presentes en los pasos intermedios. Los resultados experimentales utilizando LLM ampliamente utilizados, como Llama3.1-70B y Qwen2.5-72B, demuestran que el aprendizaje del conocimiento del estado de los ingredientes mejora la comprensión del proceso de cocción, logrando un rendimiento comparable al de los LLM comerciales. El conjunto de datos está disponible públicamente en Hugging Face.