# ModeX: Evaluator-Free Best-of-N Selection for Open-Ended Generation

### 저자

Hyeong Kyu Choi, Sharon Li

### 💡 개요

대규모 언어 모델(LLM)의 개방형 생성에서 여러 후보 결과 중 최적의 하나를 선택하는 것은 여전히 어려운 문제입니다. 기존의 Best-of-N 및 자기 일관성 방법은 외부 평가자나 보상 모델에 의존하여 적용성과 효율성이 제한적이었습니다. 본 논문은 외부 평가자 없이도 개방형 텍스트 생성에서 다수의 의미론적 합의를 나타내는 모달 출력을 식별하여 최적의 후보를 선택하는 ModeX 프레임워크를 제안합니다.

### 🔑 시사점 및 한계

- 외부 평가자, 보상 모델 또는 보조 모델 없이도 LLM의 개방형 생성에서 최적의 후보를 효과적으로 선택할 수 있습니다.

- 텍스트 요약, 코드 생성, 수학적 추론 등 다양한 개방형 작업에서 기존의 단일 및 다중 경로 베이스라인보다 우수한 성능을 보여줍니다.

- ModeX-Lite는 조기 가지치기(early pruning)를 통해 계산 효율성을 더욱 향상시킵니다.

- 제안된 방법론의 성능은 유사도 그래프 구성 및 분산 클러스터링 방식의 최적화, 다양한 LLM 아키텍처 및 작업에 대한 일반화 가능성 탐구가 향후 과제로 남아있습니다.

---

[PDF 보기](https://arxiv.org/pdf/2601.02535)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
