Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Tận dụng các phương thức âm thanh và văn bản trong sức khỏe tâm thần: Nghiên cứu về hiệu suất của LLM

Created by
  • Haebom

Tác giả

Abdelrahman A. Ali, Aya E. Fouda, Radwa J. Hanafy, Mohammed E. Fouda

Phác thảo

Nghiên cứu này nhằm mục đích cải thiện độ chính xác của chẩn đoán trầm cảm và rối loạn căng thẳng sau chấn thương (PTSD) bằng cách sử dụng các mô hình ngôn ngữ quy mô lớn (LLM). Chúng tôi đã đánh giá hiệu suất của LLM, bao gồm Gemini 1.5 Pro và GPT-4o mini, trên tập dữ liệu E-DAIC bằng hai phương thức: văn bản và âm thanh. Cụ thể, chúng tôi đã phân tích tác động của việc tích hợp phương thức đến độ chính xác chẩn đoán bằng các số liệu mới: Điểm vượt trội của phương thức và Điểm giải quyết bất đồng. Kết quả là, mô hình Gemini 1.5 Pro đạt được điểm F1 là 0,67 và độ chính xác cân bằng là 77,4% đối với phân loại trầm cảm nhị phân khi kết hợp các phương thức văn bản và âm thanh, chứng tỏ hiệu suất được cải thiện so với sử dụng một phương thức duy nhất. Điều này đạt được thông qua suy luận zero-shot. Hơn nữa, chúng tôi đã phân tích những thay đổi về hiệu suất trên nhiều tác vụ khác nhau (phân loại nhị phân, mức độ nghiêm trọng và đa lớp) và các biến thể nhắc nhở.

Takeaways, Limitations

Takeaways:
Trình bày khả năng chẩn đoán sức khỏe tâm thần đa phương thức bằng LLM.
Xác định tiềm năng cải thiện độ chính xác của chẩn đoán thông qua việc tích hợp phương thức văn bản và âm thanh.
Chứng minh tính mạnh mẽ của mô hình thông qua suy luận zero-shot.
Hiệu suất tuyệt vời của các mẫu Gemini 1.5 Pro và GPT-4o mini đã được xác nhận.
Limitations:
Hạn chế về khả năng khái quát hóa khi chỉ sử dụng một tập dữ liệu E-DAIC.
Cần phải xác thực thêm vì các chỉ số được sử dụng (Điểm vượt trội về phương thức, Điểm giải quyết bất đồng) là các chỉ số mới.
Cần nghiên cứu thêm để xác định khả năng ứng dụng của nó trong các điều kiện lâm sàng thực tế.
Có thể thiên vị một mô hình cụ thể.
👍