Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

A Highly Clean Recipe Dataset with Ingredient States Annotation for State Probing Task

Created by
  • Haebom

저자

Mashiro Toyooka, Kiyoharu Aizawa, Yoko Yamakata

개요

본 논문은 대규모 언어 모델(LLM)이 요리 과정을 이해하는 능력을 평가하기 위해 상태 탐색(state probing) 기법을 적용한 연구이다. LLM들은 방대한 양의 절차적 텍스트로 학습되지만, 실제 현상을 직접 관찰하지 못하기 때문에 요리 레시피의 중간 과정을 정확하게 이해하는 데 어려움을 겪는다. 이를 해결하기 위해, 명확하고 정확한 재료 상태 변화 주석이 달린 새로운 일본어 레시피 데이터셋을 구축하고, 이를 바탕으로 LLM이 요리 과정 중 재료 상태 변화를 추적하고 중간 단계에서 존재하는 재료를 식별하는 능력을 평가하는 세 가지 새로운 과제를 제시한다. Llama3.1-70B 및 Qwen2.5-72B와 같은 널리 사용되는 LLM을 사용한 실험 결과, 재료 상태 지식 학습이 요리 과정에 대한 이해도를 향상시켜 상용 LLM과 비슷한 성능을 달성함을 보여준다. 데이터셋은 Hugging Face에서 공개적으로 이용 가능하다.

시사점, 한계점

시사점:
LLM의 요리 과정 이해 능력 평가를 위한 새로운 방법론과 데이터셋을 제시하였다.
재료 상태 지식 학습이 LLM의 요리 과정 이해도 향상에 효과적임을 실험적으로 증명하였다.
공개된 데이터셋을 통해 향후 관련 연구를 위한 기반을 마련하였다.
한계점:
현재 데이터셋은 일본어 레시피에 국한되어 있다. 다른 언어로 확장하기 위한 추가 연구가 필요하다.
실험에 사용된 LLM이 제한적이므로, 다양한 LLM에 대한 추가 실험이 필요하다.
요리 과정의 모든 측면을 포괄하지는 않을 수 있다. 예를 들어, 감각적 요소(맛, 향 등)에 대한 고려는 부족할 수 있다.
👍