Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

ByteGen: Mô hình tạo không cần tokenizer cho các sự kiện sổ lệnh trong không gian Byte

Created by
  • Haebom

Tác giả

Dương Lập, Chí Thần

Phác thảo

Bài báo này trình bày một mô hình sinh mới, ByteGen, để giải quyết vấn đề đầy thách thức của mô hình sinh động lực sổ lệnh tần suất cao (LOB). Các phương pháp tiếp cận hiện tại gặp phải những hạn chế do phụ thuộc vào các giả định xác suất được đơn giản hóa hoặc, trong trường hợp của các mô hình học sâu hiện đại như Transformer, các kỹ thuật mã hóa ảnh hưởng đến các thuộc tính số có độ chính xác cao của dữ liệu. ByteGen khắc phục những hạn chế này bằng cách xử lý trực tiếp luồng byte thô của các sự kiện LOB. Để biểu diễn các thông điệp thị trường mà không bị mất thông tin, chúng tôi thiết kế một định dạng nhị phân nén 32 byte và giải quyết vấn đề này bằng một tác vụ dự đoán byte tiếp theo tự hồi quy. Bằng cách loại bỏ hoàn toàn kỹ thuật tính năng và mã hóa, chúng tôi học được động lực thị trường từ một biểu diễn cơ bản. Bằng cách áp dụng kiến trúc H-Net, chúng tôi sử dụng cơ chế phân đoạn động để khám phá cấu trúc vốn có của các thông điệp thị trường mà không có các quy tắc được xác định trước. Bằng cách đào tạo trên hơn 34 triệu sự kiện từ hợp đồng tương lai Bitcoin của CME, chúng tôi đã tái tạo thành công các đặc điểm chính của thị trường tài chính, bao gồm phân phối giá thực tế, lợi nhuận đuôi nặng và thời gian sự kiện bùng nổ.

Takeaways, Limitations

Takeaways:
Trình bày khuôn khổ cấp byte đầu tiên cho mô hình hóa LOB.
Đề Xuất phương pháp biểu diễn dữ liệu nén hiệu quả.
ĐạT được hiệu suất cạnh tranh theo các chỉ số chất lượng thị trường tiêu chuẩn mà không có sự thiên vị về mã thông báo.
Chúng tôi chứng minh rằng việc học trực tiếp trong không gian byte là một mô hình linh hoạt và đầy hứa hẹn để mô hình hóa các hệ thống tài chính phức tạp.
Limitations:
Hiện tại, chỉ có kết quả về dữ liệu hợp đồng tương lai Bitcoin của CME được trình bày và cần nghiên cứu thêm để xác định khả năng tổng quát hóa cho các tài sản hoặc thị trường khác.
Việc thiếu mô tả chi tiết về cơ chế phân đoạn động của kiến trúc H-Net đòi hỏi phải xác minh khả năng tái tạo.
Thiếu phân tích về khả năng mở rộng của mô hình và chi phí tính toán.
👍