NutriBench: A Dataset for Evaluating Large Language Models on Nutrition Estimation from Meal Descriptions
Created by
Haebom
저자
Andong Hua, Mehak Preet Dhaliwal, Ryan Burke, Laya Pullela, Yao Qin
개요
NutriBench는 실제 세계의 글로벌 식이 섭취 데이터에서 생성된 11,857개의 식사 설명으로 구성된 최초의 공개적으로 이용 가능한 자연어 식사 설명 영양 벤치마크입니다. 데이터는 사람이 검증하고 탄수화물, 단백질, 지방 및 칼로리 등의 매크로 영양소 라벨이 주석 처리되어 있습니다. 본 논문에서는 GPT-4o, Llama3.1, Qwen2, Gemma2 및 OpenBioLLM 모델을 포함한 12개의 주요 대규모 언어 모델(LLM)을 사용하여 탄수화물 추정 작업에 대한 NutriBench의 광범위한 평가를 수행합니다. 표준, 사고연쇄 및 검색 증강 생성 전략을 사용했습니다. 또한, 전문 영양사를 대상으로 한 연구를 통해 LLM이 비슷하지만 훨씬 빠른 추정치를 제공할 수 있음을 보여줍니다. 마지막으로, 당뇨병 환자의 혈당 수치에 대한 탄수화물 예측의 영향을 시뮬레이션하여 실제 위험 평가를 수행합니다. 본 연구는 LLM을 사용하여 영양 추정을 하는 것의 기회와 과제를 강조하며, 전문가와 일반인을 지원하고 건강 결과를 개선할 수 있는 잠재력을 보여줍니다. 벤치마크는 https://mehak126.github.io/nutribench.html 에서 공개적으로 이용 가능합니다.