Bài báo này trình bày một mô hình sinh mới, ByteGen, để giải quyết vấn đề đầy thách thức của mô hình sinh động lực sổ lệnh tần suất cao (LOB). Các phương pháp tiếp cận hiện tại gặp phải những hạn chế do phụ thuộc vào các giả định xác suất được đơn giản hóa hoặc, trong trường hợp của các mô hình học sâu hiện đại như Transformer, các kỹ thuật mã hóa ảnh hưởng đến các thuộc tính số có độ chính xác cao của dữ liệu. ByteGen khắc phục những hạn chế này bằng cách xử lý trực tiếp luồng byte thô của các sự kiện LOB. Để biểu diễn các thông điệp thị trường mà không bị mất thông tin, chúng tôi thiết kế một định dạng nhị phân nén 32 byte và giải quyết vấn đề này bằng một tác vụ dự đoán byte tiếp theo tự hồi quy. Bằng cách loại bỏ hoàn toàn kỹ thuật tính năng và mã hóa, chúng tôi học được động lực thị trường từ một biểu diễn cơ bản. Bằng cách áp dụng kiến trúc H-Net, chúng tôi sử dụng cơ chế phân đoạn động để khám phá cấu trúc vốn có của các thông điệp thị trường mà không có các quy tắc được xác định trước. Bằng cách đào tạo trên hơn 34 triệu sự kiện từ hợp đồng tương lai Bitcoin của CME, chúng tôi đã tái tạo thành công các đặc điểm chính của thị trường tài chính, bao gồm phân phối giá thực tế, lợi nhuận đuôi nặng và thời gian sự kiện bùng nổ.