[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

ScaleRTL: Mở rộng LLM với Dữ liệu suy luận và Tính toán thời gian kiểm tra để tạo mã RTL chính xác

Created by
  • Haebom

Tác giả

ĐặNg Trần Huy, Vân Đại Tsai, Lưu Quan Đình, Trung Chí Ngọc, Nhâm Hạo Hưng

Phác thảo

Trong bài báo này, chúng tôi đề xuất ScaleRTL, LLM dựa trên suy luận đầu tiên mở rộng dữ liệu suy luận chất lượng cao và tính toán thời gian kiểm thử để giải quyết các hạn chế của việc tạo mã RTL bằng các mô hình ngôn ngữ quy mô lớn (LLM). Để khắc phục những khó khăn về việc kéo dài thời gian kiểm thử do thiếu dữ liệu và các đặc điểm không suy luận của các phương pháp hiện có, chúng tôi xây dựng một tập dữ liệu mã thông báo 3,5 tỷ chứa nhiều quy trình suy luận dạng dài với trung bình 56 nghìn mã thông báo. Sử dụng tập dữ liệu này, chúng tôi tinh chỉnh một mô hình suy luận chung để phát triển ScaleRTL, cho phép suy luận RTL sâu. Hơn nữa, chúng tôi cải thiện hiệu suất bằng cách giới thiệu một chiến lược kéo dài thời gian kiểm thử mới, liên tục suy ngẫm và tự sửa các bước suy luận trước đó. Kết quả thử nghiệm cho thấy ScaleRTL đạt hiệu suất tiên tiến trên các điểm chuẩn VerilogEval và RTLLM, vượt trội hơn 18 mô hình cạnh tranh hiện có tới 18,4% (VerilogEval) và 12,7% (RTLLM).

Takeaways, Limitations

Takeaways:
Chúng tôi đạt được những cải tiến về hiệu suất trong việc tạo mã RTL dựa trên LLM bằng cách tận dụng dữ liệu suy luận chất lượng cao và tiện ích mở rộng tính toán thời gian thử nghiệm.
Chúng tôi trình bày một kỹ thuật xây dựng và tinh chỉnh tập dữ liệu mới sử dụng quy trình suy luận dạng dài.
Hiệu suất được cải thiện thêm nhờ chiến lược kéo dài thời gian thử nghiệm mới.
ĐạT được hiệu suất tiên tiến nhất trên các tiêu chuẩn VerilogEval và RTLLM.
Limitations:
Cần phải xác nhận thêm về hiệu suất tổng quát hóa và tính đa dạng của tập dữ liệu được trình bày.
Nhu cầu phân tích chi phí tính toán và hiệu quả của các chiến lược kéo dài thời gian thử nghiệm.
Cần phải xem xét lại khả năng áp dụng mã RTL phức tạp tại các địa điểm công nghiệp thực tế.
Cần nghiên cứu về khả năng mở rộng sang các ngôn ngữ lập trình và nền tảng phần cứng khác.
👍