본 논문은 대규모 언어 모델(LLM)을 이용하여 비정형 텍스트 데이터(레시피)를 구조화된 형식(Cooklang)으로 변환하는 가능성을 체계적으로 평가한 연구입니다. GPT-4o, GPT-4o-mini, Llama3.1:70b, Llama3.1:8b 네 가지 모델을 사용하여 실험을 진행하였으며, 기존의 WER, ROUGE-L, TER과 같은 평가 지표와 의미 요소 식별을 위한 특수 지표를 결합한 혁신적인 평가 방식을 제시하였습니다. 실험 결과, GPT-4o 모델은 퓨샷 프롬프팅을 통해 탁월한 성능(ROUGE-L: 0.9722, WER: 0.0730)을 달성하여, 광범위한 학습 없이도 LLM이 특정 도메인의 비정형 텍스트를 신뢰할 수 있게 구조화된 형식으로 변환할 수 있음을 최초로 보여주었습니다. 모델 성능은 일반적으로 모델 크기에 비례하지만, Llama3.1:8b와 같은 소형 모델도 목표 지향적 미세 조정을 통해 잠재력을 발휘할 수 있음을 발견하였습니다. 이러한 결과는 의료 기록부터 기술 문서에 이르기까지 다양한 분야에서 자동화된 구조화된 데이터 생성에 대한 새로운 가능성을 제시하며, 조직이 비정형 정보를 처리하고 활용하는 방식을 변화시킬 수 있습니다.