Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới. Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận. Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.
ĐáNh giá việc tạo ra dữ liệu tăng cường truy xuất so với dữ liệu đầu vào ngữ cảnh dài cho lý luận lâm sàng trên EHR
Created by
Haebom
Tác giả
Skatje Myers, Dmitriy Dligach, Timothy A. Miller, Samantha Barr, Yanjun Gao, Matthew Churpek, Anoop Mayampurath, Majid Afshar
Phác thảo
Bài báo này trình bày một nghiên cứu tận dụng các mô hình ngôn ngữ quy mô lớn (LLM) và các kỹ thuật tạo tăng cường tìm kiếm (RAG) để giải quyết các thách thức về văn bản dài, nhiễu và trùng lặp trong hồ sơ sức khỏe điện tử (EHR). Để giải quyết cửa sổ ngữ cảnh hạn chế của các LLM hiện có, chúng tôi sử dụng RAG để truy xuất các đoạn văn liên quan đến nhiệm vụ từ toàn bộ EHR và áp dụng nó vào ba nhiệm vụ lâm sàng: trích xuất quy trình hình ảnh, tạo lịch trình kháng sinh và xác định chẩn đoán chính. Sử dụng dữ liệu EHR của bệnh nhân nội trú trong thế giới thực, chúng tôi đánh giá ba LLM hiện đại với lượng ngữ cảnh khác nhau. Chúng tôi chứng minh rằng RAG hoạt động tương tự hoặc tốt hơn các phương pháp chỉ sử dụng hồ sơ gần đây, đạt được hiệu suất tương đương với ngữ cảnh đầy đủ với số lượng mã thông báo đầu vào ít hơn đáng kể. Điều này cho thấy RAG vẫn là một phương pháp cạnh tranh và hiệu quả ngay cả khi các mô hình mới có khả năng xử lý các văn bản dài hơn xuất hiện.
Takeaways, Limitations
•
Takeaways:
◦
Chúng tôi chứng minh rằng kỹ thuật RAG có thể giải quyết hiệu quả vấn đề văn bản dài trong EHR.
◦
Chúng tôi trình bày ba thách thức lâm sàng có thể được áp dụng trên nhiều hệ thống chăm sóc sức khỏe với nỗ lực tối thiểu.
◦
Khắc phục những hạn chế của cửa sổ ngữ cảnh trong LLM và trình bày khả năng trích xuất và suy luận thông tin hiệu quả.
◦
ĐIều này cho thấy kỹ thuật RAG có thể duy trì khả năng cạnh tranh trong các chương trình LLM tiên tiến hơn trong tương lai.
•
Limitations:
◦
Hạn chế về khả năng tổng quát hóa dữ liệu EHR được sử dụng cho các hệ thống chăm sóc sức khỏe cụ thể.
◦
Cần có thêm nghiên cứu về nhiều loại bệnh và đặc điểm của bệnh nhân.
◦
Cần phân tích sâu hơn về chiến lược tìm kiếm của kỹ thuật RAG và những thay đổi về hiệu suất theo lựa chọn LLM.
◦
Cần có thêm sự xác nhận và đánh giá an toàn để ứng dụng lâm sàng thực tế.