[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

CGP-Tuning: Ajuste de mensajes suaves con reconocimiento de estructura para la detección de vulnerabilidades de código

Created by
  • Haebom

Autor

Ruijun Feng, Hammond Pearce, Pietro Liguori, Yulei Sui

Describir

En este artículo, presentamos CGP-Tuning, un novedoso método de ajuste de avisos suaves, con reconocimiento de estructura y mejorado con grafos de código, para la detección de vulnerabilidades de software. Para abordar el problema de que las técnicas de ajuste fino existentes omiten la información estructural del código fuente, CGP-Tuning introduce incrustaciones con reconocimiento de tipo que capturan información semántica rica (p. ej., flujo de control/datos) en el grafo de código, así como un eficiente módulo de alineación intermodal que integra interacciones grafo-texto, logrando un coste computacional lineal. Los resultados experimentales en los conjuntos de datos de código fuente abierto de vanguardia LLM y DiverseVul, incluyendo CodeLlama, CodeGemma y Qwen2.5-Coder, muestran que CGP-Tuning proporciona mejoras de rendimiento independientes del modelo, manteniendo al mismo tiempo una velocidad de inferencia práctica, superando en promedio a las técnicas de ajuste de avisos suaves mejoradas con grafos de vanguardia existentes en un 4% y al registro de disparo cero sin ajustar en un 15%.

Takeaways, Limitations

Takeaways:
Demostramos que la información estructural de los gráficos de código se puede utilizar eficazmente para mejorar el rendimiento de detección de vulnerabilidades de software.
Presentamos un método novedoso para mejorar el rendimiento y al mismo tiempo reducir el costo computacional mediante una incrustación con reconocimiento de tipos y un módulo de alineación intermodal eficiente.
Es un método independiente del modelo aplicable a varios LLM de código fuente abierto.
Mejoras de rendimiento significativas con respecto al sistema de avisos de disparo cero.
Limitations:
Dado que el método presentado se evaluó solo en un conjunto de datos y LLM específicos, su desempeño de generalización en otros conjuntos de datos o LLM requiere más estudios.
Falta de discusión sobre la complejidad de generar y procesar gráficos de código.
Se necesita investigación adicional para abordar los problemas de escalabilidad que pueden surgir cuando se aplica a sistemas de software a gran escala del mundo real.
👍