# Logits are All We Need to Adapt Closed Models

### 저자

Gaurush Hiranandani, Haolun Wu, Subhojyoti Mukherjee, Sanmi Koyejo

### 개요

본 논문은 상용 대규모 언어 모델(LLM)의 블랙박스 특성으로 인해 응용 프로그램에 특화된 콘텐츠 생성을 위한 제한적인 프롬프트 튜닝에 의존하는 현실 문제를 다룹니다.  토큰 로짓(token logits)에 대한 접근이 가능하다면 프롬프트 엔지니어링을 넘어선 강력한 적응 기법이 가능할 것이라는 주장 하에,  소량의 작업별 데이터와 로짓 접근을 통해 블랙박스 LLM을 특정 응용 프로그램에 맞게 효과적으로 조정하는 토큰 수준 확률 재가중 프레임워크를 제시합니다.  다음 토큰 예측을 지도 학습 분류의 관점에서 보고, 블랙박스 LLM을 작업별 데이터에 맞추는 것을 레이블 노이즈 수정 문제로 공식화하여, 로짓에서만 작동하는 자기회귀 확률 재가중 모델인 _Plugin_ 모델을 제안합니다. 로짓 재가중만으로도 작업 적응이 충분한 이유에 대한 이론적 근거를 제공하며, 다양한 데이터셋, LLM, 재가중 모델을 사용한 광범위한 실험을 통해 방법의 효과를 입증하고, 폐쇄형 모델에서 토큰 로짓에 대한 더 넓은 접근을 옹호합니다.

### 시사점, 한계점

- **시사점:**

    - 폐쇄형 LLM의 성능 향상을 위한 새로운 접근법 제시:  토큰 로짓 접근을 통해 프롬프트 엔지니어링을 넘어선 강력한 적응 기법을 제공합니다.

    - 블랙박스 LLM 적응을 위한 효율적인 방법 제시: 소량의 데이터로 효과적으로 LLM을 특정 작업에 맞출 수 있습니다.

    - 토큰 로짓 접근의 중요성 강조:  폐쇄형 모델에서 토큰 로짓에 대한 접근성 확대의 필요성을 강조합니다.

    - 이론적 근거 제시: 로짓 재가중만으로 작업 적응이 가능한 이유에 대한 이론적 근거를 제시합니다.

- **한계점:**

    - 토큰 로짓 접근성에 대한 의존성:  본 방법은 토큰 로짓에 대한 접근을 전제로 하므로,  접근이 제한된 폐쇄형 모델에서는 적용이 어려울 수 있습니다.

    - 소량의 작업별 데이터 요구:  성능 향상을 위해서는 어느 정도의 작업별 데이터가 필요합니다. 데이터가 부족한 경우 성능이 저하될 수 있습니다.

    - 다양한 LLM과 데이터셋에 대한 일반화 성능 검증 필요:  실험 결과는 제한된 LLM과 데이터셋에 국한될 수 있으므로,  다양한 환경에서의 일반화 성능을 추가적으로 검증해야 합니다.

[PDF 보기](https://arxiv.org/pdf/2502.06806)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).