基于大型语言模型 (LLM) 的多智能体系统 (LLM-MAS) 在解决协作问题方面表现出色,但也带来了新的安全风险。本文系统研究了针对 LLM-MAS 的意图隐藏攻击,设计了四种代表性攻击范式,并在集中式、分布式和分层通信架构中对其进行了评估。实验结果表明,这些攻击具有破坏性,并且能够轻松规避现有的防御机制。为了解决这个问题,我们提出了一个基于心理学的检测框架 AgentXposed。AgentXposed 利用 HEXACO 人格模型和 Reid 询问技术来主动识别恶意智能体的意图。在六个数据集上的实验结果表明,AgentXposed 能够有效检测各种形式的恶意行为,并在各种通信环境中表现出稳健性。