Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Khám phá các quy luật mở rộng cho các mô hình nền tảng EHR

Created by
  • Haebom

Tác giả

Sheng Zhang, Qin Liu, Naoto Usuyama, Cliff Wong, Tristan Naumann, Hoifung Poon

Phác thảo

Bài báo này trình bày nghiên cứu thực nghiệm đầu tiên nhằm xác định liệu các quy luật tỷ lệ của mô hình ngôn ngữ quy mô lớn (LLM) có thể được áp dụng cho các mô hình dựa trên hồ sơ sức khỏe điện tử (EHR) hay không. Sử dụng dữ liệu chuỗi thời gian bệnh nhân từ cơ sở dữ liệu MIMIC-IV, chúng tôi đã huấn luyện các kiến trúc Transformer với nhiều kích thước mô hình và ngân sách tính toán khác nhau. Chúng tôi đã quan sát thấy các mô hình tỷ lệ nhất quán, bao gồm đường cong IsoFLOP bậc hai và mối quan hệ lũy thừa giữa tính toán, các tham số mô hình, kích thước dữ liệu và tiện ích lâm sàng. Điều này chứng minh rằng các mô hình EHR thể hiện hành vi tỷ lệ tương tự như LLM, cung cấp thông tin chi tiết mang tính dự đoán cho các chiến lược đào tạo hiệu quả về tài nguyên. Do đó, nghiên cứu này đặt nền tảng cho việc phát triển các mô hình dựa trên EHR mạnh mẽ có thể chuyển đổi các nhiệm vụ dự đoán lâm sàng và thúc đẩy y học cá nhân hóa.

Takeaways, Limitations

Takeaways:
Chúng tôi đã xác nhận theo kinh nghiệm rằng có một quy luật tỷ lệ tương tự như LLM trong các mô hình dựa trên EHR.
Bằng cách làm sáng tỏ mối quan hệ giữa tài nguyên máy tính, quy mô mô hình, quy mô dữ liệu và tiện ích lâm sàng, chúng tôi góp phần thiết lập các chiến lược đào tạo mô hình hiệu quả về tài nguyên.
Nó đặt nền tảng cho việc phát triển các mô hình dựa trên EHR mạnh mẽ có thể góp phần thúc đẩy dự đoán lâm sàng và y học cá nhân hóa.
_____T194554____-:
Vì nghiên cứu chỉ được thực hiện bằng một cơ sở dữ liệu MIMIC-IV nên cần nghiên cứu thêm để xác định khả năng khái quát hóa cho các tập dữ liệu EHR khác.
Vì nghiên cứu này chỉ giới hạn ở một kiến trúc cụ thể (Transformer) nên cần phải xác minh khả năng áp dụng của luật tỷ lệ cho các kiến trúc khác.
Cần phải đảm bảo tính đa dạng trong các chỉ số đánh giá tính hữu ích lâm sàng và thiết lập các tiêu chí đánh giá khách quan.
👍