Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

PennyLang: Pionera en la generación de código cuántico basado en LLM con un novedoso conjunto de datos centrado en PennyLane

Created by
  • Haebom

Autor

Abdul Basit, Nouhaila Innan, Muhammad Haider Asif, Minghao Shao, Muhammad Kashif, Alberto Marchisio, Muhammad Shafique

Describir

Este artículo presenta PennyLang, un conjunto de datos de alta calidad dedicado a PennyLane, para abordar la falta de conjuntos de datos de alta calidad que limita el uso de modelos de lenguaje a gran escala (LLM) en el desarrollo de software cuántico. PennyLang consta de 3347 muestras de código cuántico de PennyLane y descripciones contextuales recopiladas de libros de texto, documentos oficiales y repositorios de código abierto. Este artículo presenta tres contribuciones: la generación y publicación de PennyLang, un marco automatizado para la construcción de conjuntos de datos de código cuántico, y la evaluación de referencia utilizando múltiples modelos de código abierto dentro del pipeline de Recuperación-Generación Aumentada (RAG). Los resultados experimentales demuestran que la combinación de RAG y PennyLang mejora significativamente el rendimiento de los modelos Qwen 7B y LLaMa 4. Esto contrasta con investigaciones previas centradas en Qiskit, que contribuyen al avance del desarrollo cuántico asistido por IA al proporcionar herramientas basadas en LLM y métodos reproducibles para PennyLane.

Takeaways, Limitations

Takeaways:
Acelere el desarrollo de software cuántico basado en LLM proporcionando un conjunto de datos de alta calidad para la programación cuántica, PennyLang.
Un marco de construcción de conjuntos de datos de código cuántico automatizado puede ayudarlo a sistematizar y agilizar el proceso de construcción de conjuntos de datos.
Demostramos experimentalmente que el rendimiento de generación de código cuántico de LLM se puede mejorar significativamente aprovechando el pipeline RAG.
Proporcionar herramientas basadas en LLM a PennyLane abre nuevas posibilidades para el desarrollo cuántico habilitado por IA.
Limitations:
El conjunto de datos de PennyLang es específico de PennyLane y puede no ser directamente aplicable a otros marcos de programación cuántica.
La evaluación actual se limita a un modelo de código abierto específico y se necesita evaluar una gama más amplia de modelos.
Se necesita más investigación para explorar la generalidad y escalabilidad de los marcos de construcción de conjuntos de datos automatizados.
Dado que el rendimiento del pipeline RAG depende en gran medida de la calidad del conjunto de datos, el control de calidad del conjunto de datos es importante.
👍