Bài báo này đề cập đến thách thức của kỹ thuật nhắc nhở trong việc tối đa hóa tiềm năng của các mô hình ngôn ngữ quy mô lớn (LLM), đặc biệt là trong các nhiệm vụ yêu cầu đánh giá chất lượng chủ quan, trong đó các mục tiêu tối ưu hóa rõ ràng khó xác định. Mặc dù các phương pháp tối ưu hóa nhắc nhở tự động hiện có không hiệu quả đối với các vấn đề như vậy, trong bài báo này, chúng tôi trình bày DEEVO, một khuôn khổ tối ưu hóa nhắc nhở mới tận dụng đánh giá dựa trên thảo luận và lựa chọn dựa trên Elo. DEEVO khám phá không gian nhắc nhở rời rạc trong khi vẫn duy trì tính nhất quán ngữ nghĩa thông qua các hoạt động giao thoa thông minh và đột biến chiến lược. Nó đồng thời theo đuổi sự cải tiến và tính đa dạng của nhắc nhở bằng cách sử dụng xếp hạng Elo làm thước đo liên quan và vượt trội hơn các phương pháp hiện có đối với cả các vấn đề mở và đóng mà không có phản hồi câu trả lời đúng. Kết hợp khả năng suy luận của LLM và tối ưu hóa thích ứng, nó góp phần cải thiện liên tục các hệ thống AI mà không cần thước đo được xác định trước.