[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

MedPix 2.0: Bộ dữ liệu y sinh đa phương thức toàn diện dành cho các ứng dụng AI tiên tiến với khả năng truy xuất tăng cường và đồ thị kiến thức

Created by
  • Haebom

Tác giả

Irene Siragusa, Salvatore Contino, Massimo La Ciura, Rosario Alicata, Roberto Pirrone

Phác thảo

Bài báo này đề cập đến thách thức thiếu hụt bộ dữ liệu chất lượng cao do lo ngại về quyền riêng tư, bất chấp sự quan tâm ngày càng tăng đối với việc phát triển các ứng dụng AI trong lĩnh vực chăm sóc sức khỏe. Những tiến bộ trong mô hình ngôn ngữ thị giác (VLM) đã dẫn đến nhu cầu ngày càng tăng về bộ dữ liệu chăm sóc sức khỏe đa phương thức với các báo cáo lâm sàng và ý kiến được đính kèm vào hình ảnh chụp cắt lớp y tế. Bài báo này trình bày quy trình làm việc hoàn chỉnh để xây dựng bộ dữ liệu MedPix 2.0 dựa trên MedPix®, một bộ dữ liệu đa phương thức chủ yếu được sử dụng cho mục đích đào tạo y khoa thường xuyên cho bác sĩ, điều dưỡng và sinh viên y khoa. Một quy trình bán tự động để trích xuất dữ liệu hình ảnh và văn bản, cùng với quy trình quản lý thủ công để loại bỏ các mẫu nhiễu được sử dụng để tạo cơ sở dữ liệu MongoDB. Cùng với bộ dữ liệu, chúng tôi phát triển một giao diện người dùng đồ họa (GUI) để khám phá hiệu quả phiên bản MongoDB và thu thập dữ liệu thô có thể dễ dàng sử dụng cho việc đào tạo và/hoặc tinh chỉnh VLM. Chúng tôi giới thiệu DR-Minerva, một mô hình VLM tăng cường truy xuất được đào tạo bằng MedPix 2.0, và đề xuất một mô hình DR-Minerva mở rộng sử dụng đồ thị tri thức bằng Llama 3.1 Instruct 8B. Kiến trúc kết quả có thể được truy vấn từ đầu đến cuối như một hệ thống hỗ trợ quyết định chăm sóc sức khỏe. MedPix 2.0 có sẵn trên GitHub.

Takeaways, Limitations

Takeaways:
Chúng tôi cung cấp MedPix 2.0, một bộ dữ liệu y tế đa phương thức chất lượng cao, thiết yếu cho việc phát triển VLM trong lĩnh vực chăm sóc sức khỏe.
Cung cấp GUI để khám phá và sử dụng hiệu quả bộ dữ liệu MedPix 2.0.
Chúng tôi trình bày mô hình DR-Minerva và mô hình mở rộng có thể được sử dụng như một hệ thống hỗ trợ quyết định y tế dựa trên MedPix 2.0.
Chúng tôi đã làm cho tập dữ liệu của mình dễ truy cập hơn thông qua GitHub.
Limitations:
Thiếu thông tin cụ thể về quy mô và tính đa dạng của tập dữ liệu.
Thiếu phân tích về những sai lệch tiềm ẩn có thể phát sinh trong quá trình thu thập và xử lý dữ liệu.
Thiếu thông tin chi tiết về đánh giá hiệu suất của mô hình DR-Minerva.
Không có giải pháp cụ thể nào cho các vấn đề về quyền riêng tư (không đề cập rõ ràng đến cách thức quyền riêng tư được tính đến trong quá trình xây dựng bộ dữ liệu).
👍