Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Dự báo thời điểm dự báo: Tăng tốc các mô hình khuếch tán với Taylor có cổng tin cậy

작성자
  • Haebom

Tác giả

Xiaoliu Guan, Lielin Jiang, Hanqi Chen, Xu Zhang, Jiaxing Yan, Guanzhong Wang, Yi Liu, Zetao Zhang, Yu Wu

Phác thảo

Bài báo này đề xuất một phương pháp mới để cải thiện tốc độ suy luận của Biến áp Khuếch tán (DiT). TaylorSeer thông thường lưu trữ các đặc điểm trung gian của tất cả các khối biến áp và dự đoán các đặc điểm tương lai thông qua khai triển Taylor. Tuy nhiên, nó tiêu tốn đáng kể bộ nhớ và chi phí tính toán, đồng thời không xem xét đến độ chính xác của dự đoán. Trong bài báo này, chúng tôi giảm số lượng đặc điểm được lưu trữ bằng cách dịch chuyển mục tiêu dự đoán Taylor sang khối cuối cùng và đề xuất một cơ chế lưu trữ động dựa trên lỗi dự đoán của khối đầu tiên. Điều này cải thiện sự cân bằng giữa tốc độ và chất lượng, đạt được tốc độ suy luận tăng lần lượt 3,17 lần, 2,36 lần và 4,14 lần cho FLUX, DiT và Wan Video.

Takeaways, Limitations

Takeaways:
Giải quyết hiệu quả vấn đề bộ nhớ và tính toán phức tạp của TaylorSeer hiện tại, Limitations.
ĐIều chỉnh linh hoạt tốc độ suy luận dựa trên độ chính xác của dự đoán thông qua cơ chế lưu trữ đệm động.
ĐạT được cả cải tiến về tốc độ và duy trì chất lượng trên nhiều mô hình DiT khác nhau.
Limitations:
Hiệu quả của phương pháp đề xuất phụ thuộc rất nhiều vào sai số dự đoán của khối đầu tiên. Hiệu suất có thể bị ảnh hưởng bởi độ chính xác của ước tính sai số.
Chỉ có kết quả thử nghiệm cho các mô hình cụ thể (FLUX, DiT, Wan Video) được trình bày, do đó khả năng khái quát hóa cho các mô hình khác cần được xác nhận thêm.
Không có thông tin chi tiết về việc tối ưu hóa các tham số của cơ chế lưu trữ đệm động (ví dụ: khả năng chịu lỗi).
👍