Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Aprendizaje rápido guiado por el conocimiento para el aseguramiento de la calidad de solicitudes en la revisión de código público

Created by
  • Haebom

Autor

Lin Li, Xinchun Yu, Xinyu Chen, Peng Liang

Describir

Este documento propone Knowledge-Guided Prompt Learning (KP-PCR), un método novedoso para predecir la necesidad de solicitudes de revisión de código de los desarrolladores y recomendar etiquetas apropiadas, para mejorar el sistema de revisión de código abierto (PCR) desarrollado en la comunidad de Software Question Answering (SQA). A diferencia de la investigación PCR anterior, que se centra principalmente en la perspectiva del revisor, KP-PCR se centra en mejorar la satisfacción de las solicitudes de los desarrolladores. Para lograr esto, realiza dos subtareas: predicción de la necesidad de solicitud y recomendación de etiquetas. Esta subtarea implica ajustar las indicaciones de texto basadas en un Modelo de Lenguaje Enmascarado (MLM) y ajustar el conocimiento y los prefijos de código utilizando un modelo de lenguaje a gran escala y gráficos de dependencia del programa. Los resultados finales son generados por el módulo Answer Engineering. Los resultados experimentales utilizando el conjunto de datos PCR de 2011 a 2023 demuestran que KP-PCR supera a los métodos existentes en un 2,3% a 8,4% en la predicción de la necesidad de solicitud y en un 1,4% a 6,9% en la recomendación de etiquetas. El código está disponible en GitHub.

Takeaways, Limitations

Takeaways:
Un nuevo enfoque para garantizar la calidad de las solicitudes de revisión de código centradas en el desarrollador
Predecir la necesidad de solicitudes de revisión de código y mejorar el rendimiento de las recomendaciones de etiquetas a través del aprendizaje rápido guiado por el conocimiento.
Mayor eficiencia mediante cálculos livianos basados ​​en conocimiento y prefijos.
Garantizar la reproducibilidad y escalabilidad mediante código abierto
Limitations:
Generalización limitada debido a la duración y el alcance del conjunto de datos utilizado.
Posible sesgo hacia lenguajes de programación específicos o tipos de proyectos
Necesidad de una verificación de rendimiento generalizada para varios tipos de solicitudes de revisión de código
Se necesita más investigación para determinar su utilidad en entornos de desarrollo del mundo real.
👍