Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Sử dụng trực giác nhân tạo trong phân loại riêng biệt, tối giản các tóm tắt khoa học để quản lý danh mục công nghệ

Created by
  • Haebom

Tác giả

Prateek Ranka, Fred Morstatter, Alexandra Graddy-Reed, Andrea Belz

Phác thảo

Bài báo này nêu bật khó khăn của việc tự động hóa phân loại tóm tắt khoa học và đề xuất một quy trình gọi là "trực giác nhân tạo" để khắc phục những hạn chế của các phương pháp sử dụng siêu dữ liệu hiện có (văn bản thưa thớt, nhãn dư thừa). Phương pháp này tạo siêu dữ liệu bằng mô hình ngôn ngữ quy mô lớn (LLM), nhãn được tạo bằng các bản tóm tắt công khai từ Quỹ Khoa học Quốc gia Hoa Kỳ (NSF), sau đó áp dụng phương pháp này cho các bản tóm tắt từ Quỹ Khoa học Tự nhiên Quốc gia Trung Quốc (NSFC) để phân tích xu hướng tài trợ nghiên cứu. Kết quả chứng minh tính khả thi của phương pháp này đối với các hoạt động chiến lược như quản lý danh mục nghiên cứu và khám phá công nghệ.

Takeaways, Limitations

Takeaways:
'Trực giác nhân tạo' do LLM cung cấp mang lại những khả năng mới để tự động hóa phân loại trừu tượng khoa học.
Nó chứng minh tiềm năng sử dụng phân tích tóm tắt của NSF và NSFC để phân tích xu hướng tài trợ nghiên cứu.
Nó có thể đóng góp vào các hoạt động chiến lược như quản lý danh mục nghiên cứu và khám phá công nghệ.
_____T21666____:
Cần phải xác minh thêm về tính chính xác và độ tin cậy của việc tạo siêu dữ liệu bằng LLM.
Vì kết quả chỉ giới hạn ở dữ liệu NSF và NSFC nên khả năng khái quát hóa sang các tập dữ liệu khác phải được xác minh.
Cần có định nghĩa và phạm vi rõ ràng cho khái niệm 'trực giác nhân tạo'.
👍