본 논문은 사람들이 동일한 개체를 기본(bear), 상위(animal), 하위(grizzly bear) 등 여러 분류 수준에서 범주화할 수 있다는 점에 착안하여, 기존 연구에서 주로 다뤄진 기본 수준 범주가 아닌 하위 수준 범주 구성에 초점을 맞춘 최초의 연구입니다. 187개의 구체적인 단어에 대한 사람이 생성한 예시를 포함하는 새로운 이탈리아어 심리언어학 데이터셋을 제시하고, 이 데이터를 사용하여 텍스트 및 비전 LLMs이 세 가지 주요 과제(예시 생성, 범주 유도, 전형성 판단)에서 인간의 범주 구성과 일치하는 의미있는 예시를 생성하는지 평가합니다. 결과적으로 인간과 LLMs 간의 정렬도가 낮다는 것을 보여주지만, 그 성능은 의미 영역에 따라 크게 다름을 확인했습니다. 결론적으로, 이 연구는 심리학 및 언어학 연구를 지원하기 위한 AI 생성 예시의 가능성과 한계를 모두 강조합니다.