LLM 기반 챗봇의 외생적 평가 부재 문제를 해결하기 위해, 영양 분야에서 최초의 무작위 대조 시험(RCT)을 수행. 규칙 기반 챗봇에 LLM 기반의 (1) 대화 다양성 및 참여를 위한 메시지 재작성, (2) 미세 조정된 모델을 통한 영양 상담 기능을 추가. 7주간의 RCT(n=81)에서 LLM 통합 챗봇과 비교. 식단 결과, 정서적 웰빙, 참여도 측정. LLM 기반 기능은 내부 평가에서 우수했지만, 실제 환경에서는 일관된 이점을 제공하지 못함.