Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Apprentissage rapide guidé par les connaissances pour l'assurance qualité des demandes dans le cadre de la revue de code public

Created by
  • Haebom

Auteur

Lin Li, Xinchun Yu, Xinyu Chen, Peng Liang

Contour

Cet article propose l'apprentissage guidé par les connaissances (KP-PCR), une nouvelle méthode permettant de prédire les besoins en matière de demandes de révision de code des développeurs et de recommander des balises appropriées, afin d'améliorer le système de révision de code ouvert (PCR) développé par la communauté des questions-réponses logicielles (SQA). Contrairement aux recherches PCR précédentes, qui se concentraient principalement sur le point de vue du réviseur, KP-PCR vise à améliorer la satisfaction des demandes des développeurs. Pour ce faire, il effectue deux sous-tâches : la prédiction des besoins en requêtes et la recommandation de balises. Cette sous-tâche consiste à optimiser les invites textuelles selon un modèle de langage masqué (MLM) et à affiner les préfixes de connaissances et de code à l'aide d'un modèle de langage à grande échelle et de graphes de dépendances de programme. Les résultats finaux sont générés par le module Answer Engineering. Les résultats expérimentaux utilisant l'ensemble de données PCR de 2011 à 2023 démontrent que KP-PCR surpasse les méthodes existantes de 2,3 % à 8,4 % en termes de prédiction des besoins en requêtes et de 1,4 % à 6,9 % en termes de recommandation de balises. Le code est disponible sur GitHub.

Takeaways, Limitations_

Takeaways:
Une nouvelle approche pour garantir la qualité des demandes de révision de code centrées sur le développeur
Prédire le besoin de demandes de révision de code et améliorer les performances de recommandation de balises grâce à un apprentissage rapide guidé par les connaissances.
Efficacité accrue grâce à des calculs légers basés sur des préfixes et basés sur les connaissances.
Assurer la reproductibilité et l'évolutivité grâce au code ouvert
Limitations:
Généralisabilité limitée en raison de la durée et de la portée de l’ensemble de données utilisé.
Possible biais envers des langages de programmation ou des types de projets spécifiques
Nécessité d'une vérification généralisée des performances pour différents types de demandes de révision de code
Des recherches supplémentaires sont nécessaires pour déterminer son utilité dans des environnements de développement réels.
👍