[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

¿Los modelos de IA ayudan a producir correcciones de errores verificadas?

Created by
  • Haebom

Autor

Li Huang, Ilgiz Mustafin, Marco Piccioni, Alessandro Schena, Reto Weber, Bertrand Meyer

Describir

En este documento, llevamos a cabo un experimento de depuración de programas dirigido a dos grupos de programadores (grupo de acceso LLM y grupo de acceso no LLM) para verificar la eficacia de la reparación automática de programas (APR) utilizando modelos de lenguaje a gran escala (LLM). Verificamos formalmente la corrección de las correcciones propuestas utilizando un entorno de prueba de programas y establecimos preguntas de investigación, elementos de respuesta específicos e indicadores de medición utilizando un enfoque de objetivo-consulta-métrica. A pesar del tamaño limitado de la muestra, dimos el primer paso para aclarar el papel de los LLM en la corrección de errores del programa. Los resultados experimentales mostraron resultados diferentes de las expectativas de la depuración basada en IA y el APR existentes. Además, presentamos una metodología detallada para experimentos de depuración utilizando LLM, análisis del comportamiento del programador mediante grabación de sesión completa, definición de siete patrones de uso de LLM y consejos probados para utilizar eficazmente LLM en la depuración y el APR.

Takeaways, Limitations

Takeaways:
Presentación de resultados de investigación empírica sobre la depuración de programas utilizando LLM y la efectividad de APR.
Presentar estrategias de utilización efectivas a través del análisis de patrones de uso de LLM.
En otros estudios, presentamos una metodología de experimento de depuración basada en LLM reutilizable.
Presenta cómo utilizar registros de sesión detallados para analizar el comportamiento del programador.
Revelando la brecha entre las expectativas existentes y los resultados reales para la depuración basada en IA y APR.
Limitations:
Dificultad para generalizar debido al tamaño limitado de la muestra.
Diseño del estudio dependiente del entorno de verificación del programa específico.
Posible falta de consideración de varios factores que pueden afectar el desempeño de un LLM (por ejemplo, tipo de LLM, lenguaje de programación, etc.).
👍