AI 검색은 대규모 언어 모델(LLM)과 광범위한 외부 지식 소스의 연결에 의존한다. 그러나 웹 페이지, PDF 파일 등은 LLM에 바로 사용할 수 있도록 준비되지 않았다. 본 논문은 원시 텍스트를 LLM에서 사용할 수 있는 지식 표현으로 변환하는 일반적인 프레임워크인 Model-Document Protocol (MDP)을 소개한다. MDP는 에이전트 기반 추론, 메모리 기반 및 구조적 활용과 같은 여러 경로를 정의하여, 비구조적 문서를 작업 특정 LLM 입력으로 변환한다. MDP-Agent는 에이전트 기반 프로세스를 통해 MDP를 구현하며, 정보 검색 벤치마크에서 기존 방법보다 성능이 우수함을 입증한다.