Este artículo presenta un nuevo protocolo de diseño de parámetros de detección óptimos para la detección de campos magnéticos ultrasensibles y ultradébiles en la detección magnética cuántica. Los algoritmos adaptativos convencionales o los métodos de búsqueda basados en fórmulas presentan limitaciones en eficiencia o convergencia a la optimalidad cuando el rango de la señal de interés (SoI) es amplio y el sensor cuántico está sujeto a restricciones físicas. Para abordar estas limitaciones, proponemos un nuevo protocolo que utiliza un método de optimización en dos etapas. En la primera etapa, se utiliza una red neuronal bayesiana con parámetros de detección fijos para limitar el rango de SoI. En la segunda etapa, se diseña un agente de aprendizaje de refuerzo federado para ajustar con precisión los parámetros de detección dentro del espacio de búsqueda reducido. Nuestra evaluación, bajo la desafiante tarea de lectura única de espines de electrones del centro NV dentro de un tiempo de detección total limitado, produce una estimación del campo magnético de CC de amplio rango con una precisión y una eficiencia de recursos significativamente mejoradas en comparación con las técnicas existentes.