この論文は、大規模言語モデル(LLM)が調理プロセスを理解する能力を評価するために状態探索技術を適用した研究です。 LLMは大量の手続き型テキストで学習されていますが、実際の現象を直接観察することはできないため、料理レシピの中間プロセスを正確に理解するのが困難です。これを解決するために、明確で正確な材料状態変化注釈付きの新しい日本語レシピデータセットを構築し、それに基づいて、LLMが調理プロセス中の材料状態変化を追跡し、中間段階で存在する材料を識別する能力を評価する3つの新しい課題を提示します。 Llama3.1-70BやQwen2.5-72Bなどの広く使用されているLLMを用いた実験は、材料状態の知識学習が調理プロセスの理解を向上させ、商用LLMと同様の性能を達成することを示しています。データセットはHugging Faceで公に利用可能です。