대규모 언어 모델(LLM)이 개인적인 조언, 정신 건강 지원, 도덕적 지침 등 민감한 일상 환경에 점점 더 많이 사용됨에 따라 복잡한 도덕적 추론에서 유도된 가치를 이해하는 것이 중요합니다. 본 연구는 LLM 토론을 사용하여 다중 턴 설정에서 심의 역학과 가치 정렬을 조사합니다. GPT-4.1, Claude 3.7 Sonnet, Gemini 2.0 Flash의 세 가지 모델을 "Am I the Asshole" 커뮤니티의 1,000가지 일상적 딜레마에서 비난을 할당하도록 했습니다. 동기식(병렬 응답) 및 라운드 로빈(순차 응답) 형식을 모두 사용하여 순서 효과 및 평결 수정을 테스트했습니다.