본 논문은 대규모 언어 모델(LLM) 기반 생성 에이전트가 인간과 유사한 방식으로 작업을 생성하는지 여부를 조사하기 위해 인간과 GPT-4o를 대상으로 작업 생성 실험을 수행했습니다. 실험 결과, 인간의 작업 생성은 개방성과 같은 개인적 가치와 인지 스타일과 같은 심리적 동인에 의해 일관되게 영향을 받는 반면, LLM은 심리적 동인을 명시적으로 제공받더라도 이러한 행동 패턴을 반영하지 못하는 것으로 나타났습니다. LLM이 생성한 작업은 사회적이지 않고, 신체적 활동이 적으며, 추상적인 주제에 치우쳐 있었습니다. LLM이 생성한 작업이 더 재미있고 참신하다는 평가를 받았지만, 이는 LLM의 언어 능력과 인간과 유사한 구체적인 목표를 생성하는 능력 사이의 차이를 보여줍니다. 결론적으로 인간 인지의 가치 중심적이고 구체적인 특성과 LLM의 통계적 패턴 사이에는 근본적인 차이가 있으며, 더욱 인간 중심적인 에이전트를 설계하려면 내적 동기와 물리적 기반을 통합해야 합니다.