PepThink-R1, một khuôn khổ sinh sản tích hợp các mô hình ngôn ngữ quy mô lớn (LLM), học có giám sát chuỗi suy nghĩ (CoT) và học tăng cường (RL), được đề xuất để giải quyết những thách thức của không gian tìm kiếm rộng lớn, dữ liệu thực nghiệm hạn chế và khả năng diễn giải kém của các mô hình sinh sản hiện có trong quá trình thiết kế peptide điều trị. PepThink-R1 suy ra rõ ràng các biến đổi ở cấp độ monome trong quá trình tạo chuỗi peptide, cho phép các lựa chọn thiết kế có thể diễn giải được đồng thời tối ưu hóa các đặc tính dược lý đa dạng. Được hướng dẫn bởi một hàm thưởng tùy chỉnh cân bằng giữa tính khả thi về mặt hóa học và cải thiện đặc tính, mô hình tự động khám phá các biến thể trình tự khác nhau. Kết quả thực nghiệm chứng minh rằng PepThink-R1 tạo ra các peptide vòng với độ ưa mỡ, độ ổn định và khả năng tiếp xúc được cải thiện đáng kể so với các LLM thông thường (ví dụ: GPT-5) và các mô hình cơ sở miền cụ thể, thể hiện hiệu suất vượt trội về cả tỷ lệ thành công tối ưu hóa và khả năng diễn giải. Nghiên cứu này trình bày khuôn khổ thiết kế peptide dựa trên LLM đầu tiên kết hợp suy luận rõ ràng với kiểm soát đặc điểm dựa trên RL, đánh dấu một bước tiến tới tối ưu hóa peptide điều trị đáng tin cậy và minh bạch.