본 논문은 대규모 언어 모델(LLM)의 도덕적 추론 능력이 복잡한 다요소 도덕적 딜레마에 직면했을 때 종종 불일치를 보이는 문제를 해결하기 위해, 여러 LLM의 도덕적 판단을 종합하여 집단적으로 도출된 도덕적 판단을 형성하는 프레임워크를 제안한다. 이 프레임워크는 모델의 신뢰성을 고려하여 연속적인 도덕적 수용 가능성 점수를 집단 확률로 융합하는 집계 메커니즘을 사용한다. 또한, 합의에서 크게 벗어나는 모델의 경우, 도덕 철학 이론에 대한 토큰 임베딩을 미세 조정하여 합의와의 JS 발산을 최소화하면서 의미적 무결성을 유지하는 목표 지향적 임베딩 최적화 절차를 적용한다. 대규모 사회적 도덕적 딜레마 데이터 세트에 대한 실험을 통해 이 방법이 강력한 합의를 구축하고 개별 모델의 충실도를 향상시킨다는 것을 보여준다.