यह पत्र एक अध्ययन प्रस्तुत करता है जो खाना पकाने की प्रक्रिया को समझने के लिए बड़े पैमाने पर भाषा मॉडल (एलएलएम) की क्षमता का मूल्यांकन करने के लिए राज्य जांच तकनीकों को लागू करता है। एलएलएम को प्रक्रियात्मक पाठ की विशाल मात्रा पर प्रशिक्षित किया जाता है, लेकिन क्योंकि उनके पास वास्तविक दुनिया की घटनाओं का प्रत्यक्ष अवलोकन नहीं होता है, वे खाना पकाने के व्यंजनों में मध्यवर्ती चरणों को सटीक रूप से समझने के लिए संघर्ष करते हैं। इसे संबोधित करने के लिए, हम सामग्री की स्थिति में परिवर्तनों के स्पष्ट और सटीक एनोटेशन के साथ एक नया जापानी रेसिपी डेटासेट बनाते हैं। इस डेटासेट के आधार पर, हम खाना पकाने की प्रक्रिया के दौरान सामग्री की स्थिति में परिवर्तनों को ट्रैक करने और मध्यवर्ती चरणों में मौजूद सामग्रियों की पहचान करने के लिए एलएलएम की क्षमता का मूल्यांकन करने के लिए तीन नए कार्य प्रस्तुत करते हैं। व्यापक रूप से उपयोग किए जाने वाले एलएलएम, जैसे कि लामा 3.1-70 बी और क्वेन 2.5-72 बी का उपयोग करके प्रायोगिक परिणाम दर्शाते हैं