Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

A Highly Clean Recipe Dataset with Ingredient States Annotation for State Probing Task

Created by
  • Haebom

作者

豊岡真宏、杏原綾川、横浜横山

概要

この論文は、大規模言語モデル(LLM)が調理プロセスを理解する能力を評価するために状態探索技術を適用した研究です。 LLMは大量の手続き型テキストで学習されていますが、実際の現象を直接観察することはできないため、料理レシピの中間プロセスを正確に理解するのが困難です。これを解決するために、明確で正確な材料状態変化注釈付きの新しい日本語レシピデータセットを構築し、それに基づいて、LLMが調理プロセス中の材料状態変化を追跡し、中間段階で存在する材料を識別する能力を評価する3つの新しい課題を提示します。 Llama3.1-70BやQwen2.5-72Bなどの広く使用されているLLMを用いた実験は、材料状態の知識学習が調理プロセスの理解を向上させ、商用LLMと同様の性能を達成することを示しています。データセットはHugging Faceで公に利用可能です。

Takeaways、Limitations

Takeaways:
LLMの調理プロセス理解能力を評価するための新しい方法論とデータセットを提示しました。
材料状態知識学習がLLMの調理過程の理解度向上に効果的であることを実験的に証明した。
公開されたデータセットを通じて、今後関連研究のための基盤を設けた。
Limitations:
現在、データセットは日本語レシピに限定されています。他の言語に拡張するためのさらなる研究が必要です。
実験に使用されるLLMは限られているので、さまざまなLLMに対する追加の実験が必要です。
調理プロセスのあらゆる側面をカバーするわけではありません。例えば、感覚的要素(味、香りなど)の考慮は不十分かもしれません。
👍