실시간 소셜 엔지니어링(피싱, 사칭, 전화 사기 등)을 악용하는 사기가 지속적으로 증가함에 따라, 능동적으로 사기 대화를 탐지하고 방해하는 개인 정보 보호 기반의 AI 시스템을 제안합니다. 이 시스템은 instruction-tuned AI, 안전을 고려한 유틸리티 함수, 그리고 원시 데이터 공유 없이 지속적인 모델 업데이트를 위한 연합 학습을 결합합니다. 실험 결과는 유창하고 매력적인 응답 생성, 현실성, 안전성 및 효과의 상당한 개선을 보여줍니다. 연합 학습 환경에서도 높은 수준의 참여, 관련성, 그리고 낮은 개인 식별 정보(PII) 누출을 유지하며, 차등 프라이버시 설정에서도 성능 저하 없이 견고한 프라이버시를 달성할 수 있음을 확인했습니다.