본 논문은 심리학적 방법을 활용하여 대규모 언어 모델(LLM)의 규칙 적용에 대한 개념적 이해를 조사합니다. LLM이 생성하는 사고의 다양성을 인간 표본에서 관찰된 다양성과 일치시키는 새로운 절차를 도입하여, 인간과 LLM의 규칙 기반 의사결정을 비교하는 두 가지 실험을 수행했습니다. 연구 1에서는 조사된 모든 LLM이 훈련 데이터의 차단 시점 이전 또는 이후에 생성된 시나리오를 제시받았는지 여부에 관계없이 인간의 패턴을 복제함을 발견했습니다. 또한, 두 시나리오 집합 간에 인간에게 예상치 못한 차이점이 있음을 발견했는데, 놀랍게도 이러한 차이점조차도 LLM 응답에서 복제되었습니다. 연구 2에서는 인간의 규칙 적용의 상황적 특징인 강제 지연 시간 하에서 인간 표본이 규칙의 목적과 같은 다른 고려 사항보다 규칙의 텍스트에 더 많이 의존하는 현상을 조사했습니다. 결과적으로 Gemini Pro와 Claude 3는 강제 지연 또는 시간 압박을 설명하는 프롬프트에 인간과 유사하게 반응했지만, GPT-4o와 Llama 3.2 90b는 그렇지 않았습니다. 이를 통해 LLM이 규칙 개념에 대한 숙달을 가지고 있으며, 법적 의사결정 및 철학적 탐구에 시사점을 제공한다고 주장합니다.