Bài báo này trình bày một giao thức thiết kế tham số cảm biến tối ưu mới cho việc phát hiện từ trường cực yếu, cực nhạy trong cảm biến từ lượng tử. Các thuật toán thích ứng thông thường hoặc các phương pháp tìm kiếm dựa trên công thức có những hạn chế về hiệu quả hoặc hội tụ đến mức tối ưu khi phạm vi tín hiệu quan tâm (SoI) rộng và cảm biến lượng tử chịu các ràng buộc vật lý. Để giải quyết những hạn chế này, chúng tôi đề xuất một giao thức mới sử dụng phương pháp tối ưu hóa hai giai đoạn. Ở giai đoạn đầu tiên, mạng nơ-ron Bayes với các tham số cảm biến cố định được sử dụng để thu hẹp phạm vi SoI. Ở giai đoạn thứ hai, một tác nhân học tăng cường liên bang được thiết kế để tinh chỉnh các tham số cảm biến trong không gian tìm kiếm thu hẹp. Đánh giá của chúng tôi trong nhiệm vụ đầy thách thức là đọc một lần các spin electron tâm NV trong tổng thời gian cảm biến hạn chế mang lại ước tính từ trường DC phạm vi rộng với độ chính xác và hiệu quả tài nguyên được cải thiện đáng kể so với các kỹ thuật hiện có.