[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Mô hình nền tảng y sinh đa góc nhìn để dự đoán mục tiêu phân tử và tính chất

Created by
  • Haebom

Tác giả

Parthasarathy Suryanarayanan, Yunguang Qiu, Shreyans Sethi, Diwakar Mahajan, Hongyang Li, Yuxin Yang, Elif Eyigoz, Aldo Guzman Saenz, Daniel E. Platt, Timothy H. Rumbell, Kenney Ng, Sanjoy Dey, Myson Burch, Bum Chul Kwon, Pablo Meyer, Feixiong Cheng, Jianying Hu, Joseph A. Morrone

Phác thảo

Bài báo này tập trung vào các biểu diễn phân tử chất lượng cao, điều này rất cần thiết cho sự phát triển của các mô hình cơ bản trong nghiên cứu y sinh. Trong khi các nghiên cứu trước đây tập trung vào các biểu diễn đơn lẻ hoặc chế độ xem phân tử, MMELON (Nhúng phân tử đa chế độ xem với hợp nhất muộn) trình bày một mô hình dựa trên đa chế độ xem tích hợp đồ thị, hình ảnh và văn bản. Mỗi mô hình chế độ xem đơn được đào tạo trước với bộ dữ liệu lên tới 200 triệu phân tử và mô hình đa chế độ xem cho thấy hiệu suất tương tự như mô hình chế độ xem đơn có hiệu suất tốt nhất. Nó đã được xác thực trên hơn 120 nhiệm vụ, bao gồm độ hòa tan phân tử, đặc tính ADME và hoạt động của thụ thể liên kết protein G (GPCR), và 33 GPCR liên quan đến bệnh Alzheimer đã được xác định và các chất liên kết mạnh đã được chọn từ sàng lọc hợp chất bằng mô hình đa chế độ xem, được xác thực thông qua mô hình hóa dựa trên cấu trúc và xác định các mô típ liên kết chính.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một mô hình dựa trên biểu diễn phân tử tích hợp nhiều góc nhìn (đồ thị, hình ảnh và văn bản) và cho thấy hiệu suất mạnh mẽ hơn so với các mô hình góc nhìn đơn lẻ.
Đã Chứng minh được khả năng áp dụng vào nhiều nhiệm vụ y sinh khác nhau thông qua quá trình đào tạo trước bằng cách sử dụng tập dữ liệu gồm hơn 200 triệu phân tử.
Đề Xuất khả năng sử dụng trong việc khám phá thuốc cho GPCR liên quan đến bệnh Alzheimer và xác thực thông qua mô hình dựa trên cấu trúc.
Nó có cấu trúc giúp dễ dàng mở rộng thêm các phương thức biểu đạt khác.
Limitations:
Việc hiệu suất của mô hình đa góc nhìn được trình bày trong bài báo này tương tự như hiệu suất của mô hình một góc nhìn hiệu suất cao nhất có thể không được coi là một cải tiến rõ ràng. Cần có thêm nghiên cứu để chứng minh những cải tiến hiệu suất đáng kể hơn.
Vì đây là kết quả xác minh hiệu suất cho một tập dữ liệu và tác vụ cụ thể nên hiệu suất tổng quát cho các tập dữ liệu hoặc tác vụ khác cần được xác minh thông qua nghiên cứu bổ sung.
Do thiếu thông tin chi tiết về thành phần và đặc điểm cụ thể của bộ dữ liệu 200 triệu phân tử được sử dụng nên cần phải xem xét lại khả năng tái tạo và khả năng khái quát hóa.
👍