Bài báo này nêu bật khó khăn của việc tự động hóa phân loại tóm tắt khoa học và đề xuất một quy trình gọi là "trực giác nhân tạo" để khắc phục những hạn chế của các phương pháp sử dụng siêu dữ liệu hiện có (văn bản thưa thớt, nhãn dư thừa). Phương pháp này tạo siêu dữ liệu bằng mô hình ngôn ngữ quy mô lớn (LLM), nhãn được tạo bằng các bản tóm tắt công khai từ Quỹ Khoa học Quốc gia Hoa Kỳ (NSF), sau đó áp dụng phương pháp này cho các bản tóm tắt từ Quỹ Khoa học Tự nhiên Quốc gia Trung Quốc (NSFC) để phân tích xu hướng tài trợ nghiên cứu. Kết quả chứng minh tính khả thi của phương pháp này đối với các hoạt động chiến lược như quản lý danh mục nghiên cứu và khám phá công nghệ.