본 논문은 사용자의 개인 정보에 접근하여 복잡한 작업을 수행하는 자율 AI 에이전트의 프라이버시 문제, 특히 '데이터 최소화' 원칙 준수 여부를 평가하는 새로운 벤치마크 AgentDAM을 제시합니다. AgentDAM은 현실적인 웹 상호 작용 시나리오를 시뮬레이션하여 GPT-4, Llama-3, Claude 기반 AI 에이전트의 개인 정보 처리 제한 능력을 평가합니다. 실험 결과, 해당 에이전트들이 불필요한 민감 정보를 무심코 사용하는 경향이 있음을 보이며, 정보 유출을 줄이는 프롬프트 기반 방어 기법도 제안합니다. 결론적으로, 추론 시 데이터 최소화를 우선시하는 AI 에이전트 개발을 위한 추가 연구의 필요성을 강조합니다.