본 논문은 비정형 데이터(예: 자유 텍스트 문서, 과학 문헌)에서 구조화된 정보를 추출하는 과정을 가속화하여 과학적 발견과 지식 통합을 향상시키는 것을 목표로 합니다. 대규모 언어 모델(LLM)이 다양한 자연어 처리 작업에서 뛰어난 성능을 보였지만, 전문적인 지식과 섬세한 이해가 필요한 특정 분야에서는 효율성이 떨어지고, 작업 및 분야 간 전이성이 부족하다는 한계를 가지고 있습니다. 이러한 문제를 해결하기 위해, 본 논문에서는 온톨로지에 담긴 특정 분야의 상징적 지식을 활용하여 복잡한 도메인 콘텐츠를 더 효과적으로 탐색하는 모듈식, 작업 비의존적, 오픈소스 프레임워크인 StructSense를 제시합니다. StructSense는 자기 평가 판단자를 통한 반복적 개선을 위한 피드백 루프와 품질 보증 및 검증을 위한 사람의 개입 메커니즘을 통합합니다. 신경 과학 정보 추출 작업에 대한 적용을 통해 StructSense가 도메인 민감성과 작업 간 일반화 부족이라는 두 가지 제약을 극복할 수 있음을 보여줍니다.