본 논문은 기존의 텍스트 기반 청크화 방식의 한계를 극복하기 위해 대규모 다중 모달 모델(LMMs)을 활용한 새로운 다중 모달 문서 청크화 방식을 제시합니다. 이 방법은 PDF 문서를 페이지 단위 배치로 처리하면서 배치 간 문맥을 유지하여 여러 페이지에 걸친 표, 임베디드 시각 요소, 절차적 콘텐츠를 정확하게 처리합니다. 수동으로 작성된 질문이 포함된 PDF 문서 데이터셋을 사용하여 평가한 결과, 기존 RAG 시스템에 비해 청크 품질과 RAG 성능이 향상됨을 보였으며, 문서 구조와 의미적 일관성 유지 측면에서 우수함을 보여줍니다.