Sign In

DECIDER: A Dual-System Rule-Controllable Decoding Framework for Language Generation

Created by
  • Haebom
Category
Empty

저자

Chen Xu, Tian Lan, Yu Ji, Changlong Yu, Wei Wang, Jun Gao, Qunxi Dong, Kun Qian, Piji Li, Wei Bi, Bin Hu

개요

본 논문에서는 사전 훈련된 대규모 언어 모델(LLM)의 추론 시 의미나 스타일을 제어하는 제약된 디코딩 방법을 제시합니다. 기존의 제약된 디코딩 방법들은 목표를 탐욕적으로 명시적으로 선택함으로써 타당한 연속을 유도하지만, 인간이 목표를 향해 암묵적으로 따르는 일반적이고 자연스러운 논리를 간과할 수 있습니다. 본 논문에서는 인지 이중 과정 이론에서 영감을 얻어, 기본 LLM에 1차 논리(FOL) 추론기를 갖추고 규칙을 표현하고 평가하며, 두 시스템의 출력을 병합하여 생성을 안내하는 의사 결정 함수를 사용하는 새로운 디코딩 프레임워크 DECIDER를 제안합니다. DECIDER는 이전의 제약된 디코딩과 달리 목표 특정 단어의 격려를 여러 상위 규칙을 만족하는 모든 단어로 변환하여 논리를 LLM에 프로그래밍 방식으로 통합할 수 있게 합니다. CommonGen 및 PersonaChat에 대한 실험을 통해 DECIDER가 주어진 FOL 규칙을 효과적으로 따라 인간과 유사하고 논리적으로 제어되는 방식으로 LLM을 안내한다는 것을 보여줍니다.

시사점, 한계점

시사점:
인지 이중 과정 이론을 활용하여 LLM의 제약된 디코딩 성능을 향상시킨 새로운 프레임워크 DECIDER를 제시.
FOL 추론기를 통해 LLM에 고차원의 논리적 규칙을 프로그래밍 방식으로 통합 가능.
기존 방법보다 더 인간과 유사하고 논리적으로 제어된 방식으로 LLM을 안내.
CommonGen과 PersonaChat 실험에서 효과를 검증.
한계점:
FOL 추론기의 성능에 의존적일 수 있음. FOL로 표현하기 어려운 복잡한 규칙이나 상황에는 적용이 제한적일 수 있음.
DECIDER의 계산 비용이 기존 방법보다 높을 수 있음.
사용하는 FOL 규칙의 질에 따라 성능이 크게 영향을 받을 수 있음. 적절한 규칙 설계가 중요.
👍