디지털 플랫폼에서 허위 정보의 확산이 심각한 문제로 대두됨에 따라, 본 논문은 허위 정보 탐지를 위한 다양한 적대적 공격을 연구한다. 특히, 영어, 프랑스어, 스페인어, 아랍어, 힌디어, 중국어 간의 언어 변환 및 번역, 질의 길이 증가 후 요약, 객관식 질문으로의 구조적 재구성을 포함하는 특정 변환들을 체계적으로 연구한다. 또한, 검색 증강 생성을 활용하는 다국어, 다중 에이전트 대규모 언어 모델 프레임워크를 제시하며, 이를 웹 플러그인으로 온라인 플랫폼에 배포하는 가능성을 보여준다. 본 연구는 다양한 공격에 대한 온라인 사실 정보의 무결성을 보호하는 데 있어 AI 기반 허위 정보 탐지의 중요성을 강조하며, 웹 애플리케이션에 대한 플러그인 기반 배포의 실현 가능성을 제시한다.