Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

DeepRetro: Khám phá con đường tổng hợp ngược bằng cách sử dụng lý luận LLM lặp lại

Created by
  • Haebom

Tác giả

Shreyas Vinaya Sathyanarayana, Sharanabasava D. Hiremath, Rahil Shah, Rishikesh Panda, Rahul Jana, Riya Singh, Rida Irfan, Ashwin Murali, Bharath Ramsundar

Phác thảo

DeepRetro là một khuôn khổ tổng hợp ngược mã nguồn mở sáng tạo, giúp khám phá các lộ trình tổng hợp dẫn đến các sản phẩm tự nhiên phức tạp. Vượt qua những hạn chế của các phương pháp hiện có, DeepRetro tích hợp các mô hình ngôn ngữ quy mô lớn (LLM), các công cụ tổng hợp ngược thông thường và phản hồi của chuyên gia trong một vòng lặp thiết kế lặp. DeepRetro kết hợp độ chính xác của các phương pháp dựa trên mẫu với tính linh hoạt sinh sản của LLM, cho phép kiểm tra tính khả thi hóa học nghiêm ngặt và tinh chỉnh đệ quy. Giao diện người dùng tương tác tự động khám phá và tinh chỉnh các lộ trình tổng hợp với xác thực thuật toán và phản hồi của chuyên gia. DeepRetro vượt trội trên các tiêu chuẩn tổng hợp ngược tiêu chuẩn và đặc biệt mạnh mẽ trong việc đề xuất các lộ trình tổng hợp mới cho các sản phẩm tự nhiên phức tạp, vốn trước đây gặp nhiều thách thức với việc lập kế hoạch tự động. Các nghiên cứu điển hình chi tiết chứng minh cách thức DeepRetro có thể được sử dụng để đề xuất các lộ trình mới cho tổng hợp hoàn toàn và thúc đẩy sự hợp tác giữa người và máy trong hóa học hữu cơ. Ngoài tổng hợp ngược, DeepRetro còn trình bày một mô hình thực tế để tận dụng LLM trong khám phá khoa học. DeepRetro là mã nguồn mở, với mô tả minh bạch về thiết kế hệ thống, thuật toán và vòng lặp phản hồi của con người, cho phép ứng dụng trên nhiều lĩnh vực khoa học.

Takeaways, Limitations

Takeaways:
Một bước tiến đột phá trong việc khám phá các con đường tổng hợp sản phẩm tự nhiên phức tạp.
Trình bày một hệ thống kết hợp hiệu quả giữa ưu điểm của LLM và các phương pháp thông thường.
Trình bày khả năng đẩy nhanh quá trình khám phá khoa học thông qua sự hợp tác giữa con người và máy móc.
Tiềm năng sử dụng rộng rãi và mở rộng nghiên cứu thông qua việc công bố nguồn mở.
Nó có thể được áp dụng cho nhiều lĩnh vực khác nhau như khám phá thuốc và thiết kế vật liệu.
Limitations:
Thiếu đánh giá định lượng cụ thể về hiệu suất và hạn chế của hệ thống hiện tại.
Không có giải pháp rõ ràng cho vấn đề ảo giác của LLM. (Cần khắc phục những dự đoán không chính xác của LLM.)
Cần phải xác nhận thêm để xác định khả năng tổng quát hóa của lộ trình tổng hợp được đề xuất đối với các phân tử có độ phức tạp cao.
Việc phụ thuộc nhiều vào phản hồi của chuyên gia đòi hỏi phải xem xét đến khả năng tiếp cận.
👍