본 논문은 신경망의 내부 동작 이해의 어려움에 대한 기존 관점에 도전하는 새로운 관점을 제시합니다. 저자들은 신경망이 불투명한 블랙박스가 아니라, 원시적 집단 활동 패턴이 훈련 데이터의 규칙성을 반영한다는 "반영 가설(Reflection Hypothesis)"을 제안합니다. 이 가설을 바탕으로, 인지적으로 영감을 받은 청킹(chunking) 기법을 활용하여 고차원 신경 집단 역학을 해석 가능한 단위로 분할하고, 이를 통해 기저 개념을 반영하는 실체를 추출하는 세 가지 방법(이산 시퀀스 청킹(DSC), 집단 평균화(PA), 비지도 청킹 발견(UCD))을 제안합니다. 간단한 순환 신경망(RNN)부터 복잡한 대규모 언어 모델(LLM)까지 다양한 모델 크기에서 이 방법들의 효과를 보여주고, 추출된 실체와 구체적 또는 추상적 개념 간의 강력한 상관관계를 관찰합니다. 또한, 신경 집단에서 추출된 실체를 인위적으로 유도함으로써 네트워크의 관련 개념 생성을 효과적으로 변경할 수 있음을 보여줍니다. 결론적으로, 본 논문은 인지 원리와 자연주의적 데이터 구조를 활용하여 복잡한 학습 시스템의 숨겨진 계산을 밝히는 새로운 해석 가능성 방향을 제시합니다.