Bài báo này phân tích về mặt lý thuyết các nguyên tắc hoạt động của Decision-Driven Learning (DFL), xuất hiện trong khuôn khổ tối ưu hóa phương sai trung bình (MVO) của Markowitz để giải quyết vấn đề ước tính giá trị kỳ vọng, phương sai và hiệp phương sai của lợi nhuận tài sản không chắc chắn. Chúng tôi nêu bật những hạn chế của các mô hình dự báo dựa trên học máy hiện có, không tính đến mối tương quan giữa các tài sản khi giảm thiểu lỗi bình phương trung bình (MSE). Chúng tôi chứng minh rằng DFL kết hợp các mối tương quan giữa các tài sản vào quá trình học bằng cách cân nhắc các lỗi dự báo dựa trên MSE bằng cách nhân chúng với ma trận hiệp phương sai nghịch đảo. Trong quá trình này, DFL tạo ra các sai lệch hệ thống đánh giá quá cao lợi nhuận của các tài sản có trong danh mục đầu tư và đánh giá quá thấp các tài sản bị loại trừ. Chúng tôi chỉ ra rằng sai lệch này là lý do DFL đạt được hiệu suất danh mục đầu tư vượt trội mặc dù có lỗi dự báo cao hơn. Nói cách khác, chúng tôi nhấn mạnh rằng các sai lệch chiến lược là một tính năng, không phải là một khiếm khuyết.