Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Có thể sử dụng các mô hình ngôn ngữ lớn nguồn mở để ghi chép về khối u ở Đức không? -- Đánh giá về ghi chú của bác sĩ tiết niệu

Created by
  • Haebom

Tác giả

Stefan Lenz, Arsenij Ustjanzew, Marco Jeray, Meike Ressing, Torsten Panholzer

Phác thảo

Bài báo này trình bày kết quả đánh giá 11 mô hình ngôn ngữ quy mô lớn (LLM) nguồn mở để cải thiện hệ thống đăng ký khối u thủ công của Đức. LLM có từ 1 đến 70 tỷ tham số đã được sử dụng để đánh giá hiệu suất của chúng trên ba nhiệm vụ cơ bản: nhận dạng chẩn đoán khối u, gán mã ICD-10 và ngày trích xuất chẩn đoán đầu tiên. Sử dụng tập dữ liệu có chú thích được tạo từ ghi chú của bác sĩ tiết niệu ẩn danh, hiệu suất của các mô hình đã được phân tích bằng một số chiến lược nhắc nhở. Các mô hình Llama 3.1 8B, Mistral 7B và Mistral NeMo 12B hoạt động tốt nhất, trong khi các mô hình có ít hơn 7 tỷ tham số cho thấy hiệu suất thấp hơn đáng kể. Việc nhắc nhở bằng dữ liệu từ các lĩnh vực y tế không phải tiết niệu đã cải thiện đáng kể hiệu suất, cho thấy LLM nguồn mở có tiềm năng đáng kể để tự động hóa việc đăng ký khối u. Chúng tôi kết luận rằng các mô hình có từ 7 đến 12 tỷ tham số mang lại sự cân bằng tối ưu giữa hiệu suất và hiệu quả sử dụng tài nguyên. Mã đánh giá và tập dữ liệu được công khai.

Takeaways, Limitations

Takeaways:
Chứng minh rằng LLM nguồn mở có thể được sử dụng hiệu quả để tự động hóa tài liệu về khối u trong lĩnh vực NLP y tế của Đức.
LLM có từ 7 đến 12 tỷ tham số mang lại sự cân bằng tốt giữa hiệu suất và hiệu quả sử dụng tài nguyên.
Chúng tôi trình bày khả năng cải thiện hiệu suất bằng cách sử dụng nhiều chiến lược nhắc nhở và các tập dữ liệu bổ sung.
Một tập dữ liệu mới được phát hành để giải quyết tình trạng thiếu hụt dữ liệu trong NLP y tế của Đức.
Limitations:
ĐáNh giá chỉ giới hạn trong lĩnh vực tiết niệu và cần nghiên cứu thêm để khái quát hóa các phát hiện.
Cần phải có sự tinh chỉnh bổ sung và nghiên cứu kỹ thuật nhanh chóng để cải thiện hiệu suất của mô hình.
Các mô hình có ít hơn 7 tỷ tham số hoạt động kém, điều này làm nổi bật tầm quan trọng của quy mô mô hình.
👍