대규모 언어 모델(LLM)이 중요한 결정에 더 많이 활용됨에 따라 인간의 가치에 대한 정렬이 필수적입니다. 독점 API에 의존하는 것은 재현성과 광범위한 참여를 제한합니다. 본 연구는 로컬 오픈 소스 앙상블 토론이 정렬 지향적 추론을 개선할 수 있는지 조사합니다. 15개 시나리오, 5가지 앙상블 구성을 포함하는 150개의 토론에서 앙상블은 7점 척도에서 단일 모델 기준선보다 우수한 성능을 보였습니다(전체: 3.48 vs. 3.13). 특히 추론 깊이(+19.4%)와 논증 품질(+34.1%)에서 가장 큰 개선을 보였습니다. 진실성(+1.25점)과 인간 능력 향상(+0.80)에서 가장 큰 개선이 나타났습니다. 앙상블 기반 정렬 평가를 위한 접근 가능하고 재현 가능한 기반을 제공하기 위해 코드, 프롬프트, 토론 데이터 세트를 제공합니다.