본 논문은 다국어 정렬(Multilingual Alignment)을 통해 저자원 언어의 성능을 향상시키는 대규모 언어 모델(LLM)의 다국어 능력 향상에 대한 연구이다. 언어 특정 뉴런의 존재를 바탕으로, 새로운 뉴런 식별 알고리즘을 제안하여 언어 특정 뉴런, 언어 관련 뉴런, 언어 비특정 뉴런을 구분한다. 이를 통해 다국어 추론 과정을 다국어 이해, 공유 의미 공간 추론, 다국어 출력 공간 변환, 어휘 공간 출력의 네 단계로 나누고, 정렬 전후 모델을 분석하여 다국어 정렬 현상과 LLM의 다국어 능력을 심층적으로 이해한다. 특히, '자발적 다국어 정렬(Spontaneous Multilingual Alignment)' 현상에 대한 분석도 포함한다.