Dans cet article, nous proposons MC²A, un cadre de co-conception algorithme-matériel pour accélérer les algorithmes de Monte Carlo par chaîne de Markov (MCMC) afin de surmonter leur applicabilité limitée aux problèmes à grande échelle et aux applications concrètes. MC²A étend le modèle de ligne de toit des performances du processeur afin d'obtenir des compromis optimaux entre les paramètres de calcul, d'échantillonnage et de mémoire, et propose une architecture d'accélérateur matériel paramétrée avec des unités de traitement arborescentes programmables ISA, des échantillonneurs reconfigurables et des interconnexions crossbar. De plus, nous améliorons l'efficacité en introduisant un nouvel échantillonneur Gumbel qui élimine les opérations d'exponentiation et de normalisation. Les résultats d'évaluation sur diverses charges de travail MCMC montrent qu'il atteint une accélération jusqu'à 307,6 fois supérieure à celle des CPU, GPU, TPU et des accélérateurs MCMC de pointe.