본 연구는 언어 모델의 스케일링 법칙이 손실(loss)만을 예측할 뿐, 추론 능력과 진실성 간의 상호작용을 설명하지 못한다는 문제에서 출발합니다. 연구진은 63개의 다양한 모델 패밀리를 대상으로 추론 능력과 진실성 간의 상관관계를 측정한 결과, 모델 크기에 따라 이들의 관계가 협력적으로 변하는 '숨겨진 정렬 전환(hidden alignment transition)' 현상을 발견했습니다. 특히, 특정 임계 스케일 N_c를 기준으로 그 이하에서는 두 능력이 반비례하지만, 그 이상에서는 협력적으로 작용하며, 이는 모델 크기뿐만 아니라 아키텍처, 데이터 큐레이션, 훈련 방식 등 다양한 요인에 의해 영향을 받습니다.