Este artículo presenta un novedoso modelo generativo, ByteGen, para abordar el complejo problema del modelado generativo de la dinámica de libros de órdenes (LOB) de alta frecuencia. Los enfoques existentes presentan limitaciones debido a su dependencia de supuestos probabilísticos simplificados o, en el caso de modelos modernos de aprendizaje profundo como Transformer, técnicas de tokenización que afectan las propiedades numéricas de alta precisión de los datos. ByteGen supera estas limitaciones procesando directamente el flujo de bytes sin procesar de los eventos LOB. Para representar los mensajes de mercado sin pérdida de información, diseñamos un formato binario comprimido de 32 bytes y abordamos el problema con una tarea autorregresiva de predicción del siguiente byte. Al eliminar por completo la ingeniería de características y la tokenización, aprendemos la dinámica del mercado a partir de una representación básica. Aplicando la arquitectura H-Net, utilizamos un mecanismo de fragmentación dinámica para descubrir la estructura inherente de los mensajes de mercado sin reglas predefinidas. Mediante el entrenamiento con más de 34 millones de eventos de futuros de Bitcoin de CME, reproducimos con éxito características clave de los mercados financieros, incluyendo distribuciones de precios realistas, retornos de cola pesada y sincronización de eventos de ráfaga.