En este artículo, proponemos FastMamba, un acelerador dedicado basado en FPGA para mejorar la eficiencia de implementación de modelos de espacio de estados (SSM), como Mamba2, en dispositivos de borde con recursos limitados. FastMamba utiliza técnicas como la cuantificación de 8 bits de capas lineales mediante la transformada de Hadamard, un marco de cuantificación de potencia de dos compatible con hardware para bloques SSM y capas convolucionales, y una aproximación lineal de primer orden para la optimización de funciones no lineales. Integra unidades de procesamiento vectorial paralelo, flujos de datos de ejecución segmentados y unidades eficientes de aproximación no lineal SSM para mejorar la eficiencia computacional y reducir la complejidad del hardware. Los resultados de nuestra evaluación en el FPGA Xilinx VC709 demuestran una aceleración de 68,80x en comparación con la CPU Intel Xeon 4210R y una aceleración de 8,90x en comparación con la GPU NVIDIA RTX 3090 en tareas de preprocesamiento de entrada Mamba2-130M, y una eficiencia energética 6x en comparación con la GPU RTX 3090 en experimentos de decodificación de salida Mamba2-2.7B.