Generating Structured Outputs from Language Models: Benchmark and Studies

작성자

Haebom

카테고리

Empty

저자

Saibo Geng, Hudson Cooper, Micha{\l} Moskal, Samuel Jenkins, Julian Berman, Nathan Ranchin, Robert West, Eric Horvitz, Harsha Nori

개요

본 논문은 제약된 디코딩(constrained decoding)의 성능과 동작에 대한 체계적인 평가를 제시합니다. 제약된 디코딩은 구조화된 출력을 생성하는 데 주로 사용되는 기술이지만, 실제 효과에 대한 이해는 부족한 실정입니다. 이에 따라, 세 가지 주요 측면(제약 준수 출력 생성 효율성, 다양한 제약 유형에 대한 적용 범위, 생성된 출력의 품질)을 평가하는 프레임워크를 제시합니다. 다양하고 복잡한 제약 조건을 포함하는 10,000개의 실제 JSON 스키마로 구성된 벤치마크 JSONSchemaBench를 소개하고, Guidance, Outlines, Llamacpp, XGrammar, OpenAI, Gemini 등 6가지 최첨단 제약된 디코딩 프레임워크를 평가하여 실제 JSON 스키마를 사용한 구조화된 생성에 대한 제약된 디코딩의 기능과 한계에 대한 통찰력을 제공합니다. JSONSchemaBench는 https://github.com/guidance-ai/jsonschemabench 에서 공개됩니다.