Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

PLAME: Thiết kế MSA nhẹ thúc đẩy quá trình gấp protein từ các nhúng tiến hóa

Created by
  • Haebom

Tác giả

Hanqun Cao, Xinyi Zhou, Zijun Gao, Chenyu Wang, Xin Gao, Zhi Zhang, Chunbin Gu, Ge Liu, Pheng-Ann Heng

Phác thảo

PLAME là một khuôn khổ thiết kế MSA nhẹ được đề xuất để giải quyết hiệu suất kém của việc căn chỉnh nhiều trình tự (MSA) cho các protein có độ tương đồng thấp và protein mồ côi. Nó tận dụng các nhúng tiến hóa từ các mô hình ngôn ngữ protein được đào tạo trước để tạo ra các MSA hỗ trợ tốt hơn cho quá trình gấp nếp xuôi dòng. Chúng tôi kết hợp việc tạo MSA với mất mát bảo tồn-đa dạng, cân bằng giữa sự đồng thuận về các vị trí bảo tồn với tính bao gồm của các biến thể trình tự hợp lý. Chúng tôi phát triển một chiến lược lựa chọn MSA để lọc các ứng viên chất lượng cao và một thước đo chất lượng trình tự để dự đoán sự cải thiện về gấp nếp. Chúng tôi chứng minh những cải thiện đáng kể về độ chính xác cấu trúc (ví dụ: điểm lDDT/TM) trên chuẩn AlphaFold2 về độ tương đồng thấp/mồ côi, và những cải thiện nhất quán được quan sát thấy khi sử dụng với AlphaFold3. Chúng tôi cũng chứng minh tính hữu ích của nó như một bộ điều hợp nhẹ cho ESMFold, đạt được độ chính xác ở cấp độ AlphaFold2 trong khi vẫn duy trì tốc độ suy luận ở cấp độ ESMFold. Tóm lại, PLAME cung cấp một phương pháp thực tế để gấp nếp chất lượng cao cho các protein không có các lân cận tiến hóa mạnh.

Takeaways, Limitations

Takeaways:
Cải thiện độ chính xác dự đoán cấu trúc protein cho các protein có độ tương đồng thấp và protein mồ côi (cải thiện hiệu suất của AlphaFold2, AlphaFold3 và ESMFold).
Tăng hiệu quả tính toán nhờ thiết kế nhẹ.
Cải thiện chất lượng MSA và nâng cao hiệu suất dự đoán thông qua các chiến lược lựa chọn MSA và số liệu chất lượng trình tự.
Cải thiện khả năng tiếp cận dự đoán cấu trúc protein bằng cách cải thiện độ chính xác của ESMFold.
Limitations:
Vì bài báo này tập trung vào việc cải thiện hiệu suất của các mô hình ngôn ngữ protein cụ thể và các mô hình dự đoán cấu trúc của họ AlphaFold, nên cần nghiên cứu thêm để xác định khả năng khái quát hóa của chúng sang các mô hình hoặc phương pháp luận khác.
Cần xác nhận thêm để xác định xem hiệu suất cải thiện của PLAME có nhất quán trên tất cả các protein có độ tương đồng thấp và protein mồ côi hay không.
Có thể cần nghiên cứu thêm để tối ưu hóa các chiến lược lựa chọn MSA và số liệu chất lượng trình tự.
👍