Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

PennyLang: Tiên phong trong việc tạo mã lượng tử dựa trên LLM với bộ dữ liệu mới lấy PennyLane làm trung tâm

Created by
  • Haebom

Tác giả

Abdul Basit, Nouhaila Innan, Muhammad Haider Asif, Minghao Shao, Muhammad Kashif, Alberto Marchisio, Muhammad Shafique

Phác thảo

Bài báo này trình bày PennyLang, một bộ dữ liệu chất lượng cao dành riêng cho PennyLane, nhằm giải quyết tình trạng thiếu bộ dữ liệu chất lượng cao, vốn hạn chế việc sử dụng các mô hình ngôn ngữ quy mô lớn (LLM) trong phát triển phần mềm lượng tử. PennyLang bao gồm 3.347 mẫu mã lượng tử PennyLane và các mô tả theo ngữ cảnh được thu thập từ sách giáo khoa, tài liệu chính thức và kho lưu trữ mã nguồn mở. Bài báo này trình bày ba đóng góp: việc tạo ra và phát hành PennyLang, một khuôn khổ xây dựng bộ dữ liệu mã lượng tử tự động, và đánh giá cơ sở sử dụng nhiều mô hình mã nguồn mở trong quy trình Tạo ra Tăng cường Truy xuất (RAG). Kết quả thử nghiệm chứng minh rằng việc kết hợp RAG và PennyLang cải thiện đáng kể hiệu suất của các mô hình Qwen 7B và LLaMa 4. Điều này trái ngược với các nghiên cứu trước đây tập trung vào Qiskit, góp phần thúc đẩy sự phát triển lượng tử được hỗ trợ bởi AI bằng cách cung cấp các công cụ dựa trên LLM và các phương pháp có thể tái tạo cho PennyLane.

Takeaways, Limitations

Takeaways:
Tăng tốc phát triển phần mềm lượng tử dựa trên LLM bằng cách cung cấp bộ dữ liệu chất lượng cao cho lập trình lượng tử, PennyLang.
Khung xây dựng bộ dữ liệu mã lượng tử tự động có thể giúp bạn hệ thống hóa và hợp lý hóa quy trình xây dựng bộ dữ liệu.
Chúng tôi chứng minh bằng thực nghiệm rằng hiệu suất tạo mã lượng tử của LLM có thể được cải thiện đáng kể bằng cách tận dụng đường ống RAG.
Việc cung cấp các công cụ dựa trên LLM cho PennyLane mở ra những khả năng mới cho sự phát triển lượng tử hỗ trợ AI.
Limitations:
Bộ dữ liệu PennyLang dành riêng cho PennyLane và có thể không áp dụng trực tiếp cho các khuôn khổ lập trình lượng tử khác.
ĐáNh giá hiện tại chỉ giới hạn ở một mô hình nguồn mở cụ thể và cần đánh giá nhiều mô hình hơn.
Cần nghiên cứu thêm để khám phá tính tổng quát và khả năng mở rộng của các khuôn khổ xây dựng tập dữ liệu tự động.
Vì hiệu suất của quy trình RAG phụ thuộc rất nhiều vào chất lượng của tập dữ liệu nên việc kiểm soát chất lượng của tập dữ liệu là rất quan trọng.
👍