DocSpiral은 도메인 특정 이미지 기반 문서(예: 스캔된 보고서)에서 구조화된 데이터를 추출하는 과정을 돕는 최초의 Human-in-the-Spiral 보조 문서 주석 플랫폼입니다. 문서의 변동성으로 인해 자동화된 추출 시스템을 학습시키기 위한 인간의 주석 작업이 필요한 문제를 해결하기 위해 설계되었습니다. DocSpiral은 반복적인 사이클을 통해 인간의 주석이 모델을 학습시키고, 점진적으로 수동 개입을 줄여나가는 구조를 가지고 있습니다. 문서 형식 정규화, 포괄적인 주석 인터페이스, 평가 지표 대시보드, AI/ML 모델 개발을 위한 API 엔드포인트를 통합된 워크플로우로 제공합니다. 실험 결과, 주석 시간을 최소 41% 단축하고 모델 학습 중 세 번의 반복에서 일관된 성능 향상을 보였습니다. 무료로 이용 가능하여 이미지 기반 문서 집약적 분야(예: 지구과학, 의료)에서 AI/ML 모델 개발의 진입 장벽을 낮추고 대규모 언어 모델의 채택을 촉진하는 것을 목표로 합니다.