본 논문은 대규모 언어 모델(LLM)의 등장으로 인해 나타나는 이른바 '출현 능력(emergent abilities)'에 대한 종합적인 검토를 제공한다. 출현 능력은 고급 추론, 문맥 내 학습, 코딩, 문제 해결 등 다양한 능력을 포함하며, 규모 확장(매개변수 증가 및 훈련 데이터셋 확장)과 관련이 있다. 논문에서는 기존의 출현 능력 정의의 불일치를 비판적으로 분석하고, 이러한 능력이 나타나는 조건(스케일링 법칙, 과제 복잡성, 사전 훈련 손실, 양자화, 프롬프팅 전략 등)을 탐구한다. 또한, 강화 학습과 추론 시간 검색을 활용하여 추론과 자기 반성을 증폭하는 대규모 추론 모델(LRM)을 포함하여 전통적인 LLM을 넘어선 범위까지 검토를 확장한다. 하지만 출현 능력은 항상 긍정적인 것은 아니며, 기만, 조작, 보상 해킹 등의 유해한 행동으로 이어질 수 있다는 점을 강조하며, 안전성과 거버넌스에 대한 우려와 더 나은 평가 프레임워크 및 규제 감독의 필요성을 제기한다.