Bài báo này nhằm mục đích đẩy nhanh quá trình trích xuất thông tin có cấu trúc từ dữ liệu phi cấu trúc (ví dụ: tài liệu văn bản tự do, tài liệu khoa học) để tăng cường khám phá khoa học và tích hợp kiến thức. Mặc dù các mô hình ngôn ngữ quy mô lớn (LLM) đã chứng minh hiệu suất tuyệt vời trên nhiều tác vụ xử lý ngôn ngữ tự nhiên, nhưng chúng kém hiệu quả hơn trong một số lĩnh vực nhất định đòi hỏi kiến thức chuyên môn và hiểu biết sắc thái, đồng thời thiếu khả năng chuyển giao giữa các tác vụ và miền. Để giải quyết những thách thức này, chúng tôi trình bày StructSense, một khuôn khổ mã nguồn mở, độc lập với tác vụ, mô-đun, tận dụng kiến thức biểu tượng dành riêng cho miền được nhúng trong các thuật ngữ để khám phá nội dung miền phức tạp một cách hiệu quả hơn. StructSense tích hợp một vòng phản hồi để cải tiến lặp lại thông qua các bộ đánh giá tự đánh giá và một cơ chế can thiệp của con người để đảm bảo chất lượng và xác thực. Thông qua ứng dụng vào tác vụ trích xuất thông tin khoa học thần kinh, chúng tôi chứng minh rằng StructSense khắc phục được hai hạn chế: độ nhạy của miền và thiếu khả năng khái quát hóa chéo tác vụ.