Cet article présente un nouveau protocole de conception de paramètres de détection optimaux pour la détection de champs magnétiques ultrasensibles et ultrafaibles en détection magnétique quantique. Les algorithmes adaptatifs conventionnels ou les méthodes de recherche basées sur des formules présentent des limites d'efficacité ou de convergence vers l'optimalité lorsque la plage du signal d'intérêt (SoI) est large et que le capteur quantique est soumis à des contraintes physiques. Pour pallier ces limites, nous proposons un nouveau protocole utilisant une méthode d'optimisation en deux étapes. Dans la première étape, un réseau neuronal bayésien à paramètres de détection fixes est utilisé pour réduire la plage SoI. Dans la seconde étape, un agent d'apprentissage par renforcement fédéré est conçu pour affiner les paramètres de détection dans l'espace de recherche réduit. Notre évaluation, dans le cadre de la tâche complexe de lecture unique des spins des électrons du centre NV dans un temps de détection total limité, produit une estimation du champ magnétique DC à large plage avec une précision et une efficacité des ressources nettement améliorées par rapport aux techniques existantes.