본 논문은 청구서, 주문서, 고지서, 재무 문서와 같은 양식 문서에서 영숫자 데이터를 추출하기 위한 새로운 에이전트 기반 AI 시스템을 제안한다. 기존의 단일화된 파이프라인 방식 대신, 대규모 언어 모델(LLM) 에이전트와 강화 학습(RL) 드라이버 에이전트를 활용하여 일관적이고 자체적으로 개선되는 추출 과정을 자동화한다. LLM 추론의 불확실성을 다루기 위해 특정 작업에 맞는 프롬프트와 보상 및 페널티의 RL 정책을 사용하여 메타 프롬프팅 에이전트가 과거의 오류로부터 학습하고 프롬프트 기반 액터 에이전트를 개선하도록 설계되었다. 다양한 문서, 파일 형식, 레이아웃 및 LLM을 처리하며, 인간의 개입 없이 정확한 정보 추출을 자동화하는 것을 목표로 한다. SOIRE 및 CORD 두 개의 벤치마크 데이터셋에 대한 결과는 유망하다.