Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

ShizhenGPT: Hướng tới chương trình Thạc sĩ Y học Cổ truyền Đa phương thức

Created by
  • Haebom

Tác giả

Junying Chen, Zhenyang Cai, Zhiheng Liu, Yunjin Yang, Rongsheng Wang, Qingying Xiao, Xiangyi Feng, Zhan Su, Jing Guo, Xiang Wan, Guanjun Yu, Haizhou Li, Benyou Wang

Phác thảo

Bài báo này trình bày ShizhenGPT, mô hình ngôn ngữ quy mô lớn đa phương thức (LLM) đầu tiên chuyên về Y học cổ truyền Trung Quốc (TCM). Để giải quyết tình trạng thiếu dữ liệu TCM chất lượng cao và bản chất đa phương thức của chẩn đoán TCM, bao gồm nhiều thông tin cảm giác như thị giác, thính giác, khứu giác và chẩn đoán mạch, vốn cản trở việc áp dụng các LLM hiện có vào TCM, chúng tôi đã xây dựng một tập dữ liệu TCM quy mô lớn bao gồm hơn 100 GB dữ liệu văn bản và hơn 200 GB dữ liệu đa phương thức (bao gồm 1,2 triệu hình ảnh, 200 giờ âm thanh và tín hiệu sinh lý). Sử dụng tập dữ liệu này, ShizhenGPT đã được đào tạo trước và được huấn luyện để có được kiến ​​thức sâu rộng về TCM và khả năng suy luận đa phương thức. Kết quả đánh giá sử dụng dữ liệu Kỳ thi Chứng nhận TCM Quốc gia gần đây và các tiêu chuẩn trực quan để nhận dạng thuốc và chẩn đoán trực quan chứng minh rằng ShizhenGPT vượt trội hơn các LLM khác có quy mô tương tự và có khả năng cạnh tranh với các mô hình độc quyền quy mô lớn. Đặc biệt, trong số các LLM đa phương thức hiện có, mô hình này là mô hình tiên tiến nhất về khả năng nhận diện hình ảnh trong Y học cổ truyền Trung Quốc (TCM), thể hiện khả năng nhận diện tích hợp trên nhiều phương thức khác nhau, bao gồm âm thanh, mạch đập, khứu giác và thị giác, mở đường cho việc nhận diện và chẩn đoán Y học cổ truyền Trung Quốc đa phương thức toàn diện. Bộ dữ liệu, mô hình và mã nguồn đều được công khai.

Takeaways, Limitations

Takeaways:
Sự phát triển của ShizhenGPT, chương trình LLM đa phương thức đầu tiên chuyên về y học cổ truyền Trung Quốc, mở ra những khả năng mới cho nghiên cứu và chẩn đoán TCM.
Việc xây dựng bộ dữ liệu TCM quy mô lớn sẽ tạo nền tảng quan trọng cho nghiên cứu liên quan đến TCM trong tương lai.
Có thể áp dụng phương pháp tiếp cận toàn diện đối với Y học cổ truyền Trung Quốc thông qua khả năng xử lý nhiều loại thông tin theo cách tổng hợp.
Nghiên cứu và phát triển liên tục có thể thực hiện được thông qua các tập dữ liệu, mô hình và mã mở.
Limitations:
Có thể vẫn còn khoảng cách về hiệu suất so với các mẫu xe độc ​​quyền quy mô lớn.
Cần phải xem xét thêm về chất lượng và sự cân bằng của tập dữ liệu.
Cần phải áp dụng và xác nhận trong môi trường lâm sàng thực tế.
Cần có thêm nghiên cứu về khả năng giải thích và diễn giải của các quá trình tích hợp thông tin đa phương thức.
👍