본 논문은 대규모 언어 모델(LLM)이 자율 에이전트로서 어떻게 의미적 모호성을 활용하여 인간 사용자를 오도하는 속임수 퍼즐을 생성하는지 조사한다. "Connections" 게임에서 영감을 얻어, 제로샷 프롬프팅, 역할 주입형 적대적 프롬프트, 그리고 사람이 만든 예시를 통해 생성된 퍼즐을 체계적으로 비교하며, 에이전트 의사결정 과정을 중점적으로 분석한다. HateBERT를 이용한 계산 분석과 주관적인 인간 평가를 통해, 명시적인 적대적 에이전트 행동이 의미적 모호성을 크게 증가시켜 인지 부하를 높이고 퍼즐 해결의 공정성을 떨어뜨린다는 것을 보여준다. 이러한 결과는 LLM의 출현하는 에이전트적 특성에 대한 중요한 통찰력을 제공하고, 교육 기술과 엔터테인먼트 분야에서 자율 언어 시스템을 평가하고 안전하게 배포하기 위한 중요한 윤리적 고려 사항을 강조한다.