본 논문은 멀티모달 대형 언어 모델(MLLMs)을 활용하여 이미지 위조를 분석하는 훈련이 필요 없는 파이프라인인 Foresee를 제안합니다. Foresee는 별도의 훈련 없이 가벼운 추론 과정을 통해 기존 MLLM 기반 방법론보다 더 나은 위조 위치 정확도와 풍부한 텍스트 설명을 제공합니다. 특히, 복사-이동 조작을 위해 유연한 특징 감지기(FFD) 모듈과 유형 우선 전략을 사용합니다. 실험 결과, 다양한 위조 유형(복사-이동, 스플라이싱, 제거, 로컬 개선, 딥페이크, AIGC 기반 편집)에서 기존의 IFDL 방법보다 뛰어난 일반화 성능을 보였습니다.