Sign In

$\texttt{SEM-CTRL}$: Semantically Controlled Decoding

Created by
  • Haebom
Category
Empty

저자

Mohammad Albinhassan, Pranava Madhyastha, Alessandra Russo

개요

본 논문은 대규모 언어 모델(LLM)의 출력에서 구문적 및 의미적 정확성을 보장하는 새로운 방법인 SEM-CTRL을 제시합니다. SEM-CTRL은 컨텍스트에 민감한 제약 조건과 작업 및 인스턴스별 의미를 LLM 디코더에 직접 적용하는 통합 접근 방식입니다. Answer Set Grammars(ASG)를 사용하여 원하는 출력에 대한 제약 조건을 표현하며, 토큰 수준의 MCTS를 통합하여 이러한 제약 조건을 안내합니다. 미세 조정 없이도 기존의 LLM에 대해 정확한 완성을 보장하며, 합성 문법 생성, 조합 추론, 계획 등 다양한 작업에서 평가를 통해 소규모 사전 훈련된 LLM이 더 큰 LLM 및 최첨단 추론 모델보다 효율적으로 우수한 성능을 보이며 동시에 해결책의 정확성을 보장함을 보여줍니다.

시사점, 한계점

시사점:
LLM의 출력 정확성을 보장하는 새로운 통합 접근 방식 제시
ASG를 활용하여 복잡한 구문 및 의미 제약 조건 표현
미세 조정 없이 기존 LLM의 성능 향상 및 정확성 보장
소규모 사전 훈련된 LLM이 대규모 모델 및 최첨단 모델을 능가하는 성능을 보임
한계점:
ASG를 사용하는 것이 복잡하고 전문적인 지식을 요구할 수 있음.
특정 작업 및 인스턴스에 대한 의미를 명확하게 표현하는 데 어려움이 있을 수 있음.
MCTS의 계산 비용이 특정 상황에서 높아질 수 있음.
제시된 실험의 범위가 제한적일 수 있음. 다양한 LLM 및 작업에 대한 추가적인 평가가 필요함.
👍