Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

PennyLang : génération de code quantique basée sur LLM avec un nouvel ensemble de données centré sur PennyLang

Created by
  • Haebom

Auteur

Abdul Basit, Nouhaila Innan, Muhammad Haider Asif, Minghao Shao, Muhammad Kashif, Alberto Marchisio, Muhammad Shafique

Contour

Cet article présente PennyLang, un ensemble de données de haute qualité dédié à PennyLane, afin de pallier le manque d'ensembles de données de haute qualité qui limite l'utilisation des modèles de langage à grande échelle (LLM) dans le développement de logiciels quantiques. PennyLang se compose de 3 347 échantillons de code quantique PennyLane et de descriptions contextuelles collectées à partir de manuels, de documents officiels et de référentiels open source. Cet article présente trois contributions : la génération et la publication de PennyLang, un cadre automatisé de construction d'ensembles de données de code quantique, et une évaluation de base utilisant plusieurs modèles open source au sein du pipeline de génération augmentée par récupération (RAG). Les résultats expérimentaux démontrent que la combinaison de RAG et de PennyLang améliore significativement les performances des modèles Qwen 7B et LLaMa 4. Cela contraste avec les recherches précédentes axées sur Qiskit, contribuant à l'avancement du développement quantique assisté par l'IA en fournissant des outils basés sur les LLM et des méthodes reproductibles pour PennyLane.

Takeaways, Limitations

Takeaways:
Accélérez le développement de logiciels quantiques basés sur le LLM en fournissant un ensemble de données de haute qualité pour la programmation quantique, PennyLang.
Un cadre de construction automatisé d’ensembles de données de code quantique peut vous aider à systématiser et à rationaliser le processus de création d’ensembles de données.
Nous démontrons expérimentalement que les performances de génération de code quantique de LLM peuvent être considérablement améliorées en tirant parti du pipeline RAG.
Fournir des outils basés sur le LLM à PennyLane ouvre de nouvelles possibilités pour le développement quantique basé sur l'IA.
Limitations:
L'ensemble de données PennyLang est spécifique à PennyLane et peut ne pas être directement applicable à d'autres cadres de programmation quantique.
L’évaluation actuelle est limitée à un modèle open source spécifique, et l’évaluation d’une gamme plus large de modèles est nécessaire.
Des recherches supplémentaires sont nécessaires pour explorer la généralité et l’évolutivité des cadres de construction automatisés d’ensembles de données.
ÉTant donné que les performances du pipeline RAG dépendent fortement de la qualité de l’ensemble de données, le contrôle de la qualité de l’ensemble de données est important.
👍