Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Un estudio empírico de vulnerabilidades en paquetes de Python y su detección

Created by
  • Haebom

Autor

Haowei Quan, Junjie Wang, Xinzhe Li, Terry Yue Zhuo, Xiao Chen, Xiaoning Du

Describir

Para abordar la falta de investigación sobre la eficacia de las herramientas de detección de vulnerabilidades de paquetes de Python, este artículo presenta PyVul, el primer conjunto completo de referencias de vulnerabilidades de paquetes de Python. PyVul contiene 1157 vulnerabilidades reportadas públicamente y verificadas por desarrolladores, cada una asociada a un paquete afectado. Proporciona anotaciones a nivel de confirmación y función para adaptarse a diversas técnicas de detección, y alcanza una precisión del 100 % a nivel de confirmación y del 94 % a nivel de función mediante un método de limpieza de datos basado en LLM. El análisis de distribución de PyVul revela que las vulnerabilidades de los paquetes de Python abarcan una amplia gama de lenguajes y tipos de programación, lo que sugiere que los paquetes de Python multilingües podrían ser más susceptibles a las vulnerabilidades. Descubrimos una brecha significativa entre el rendimiento de las herramientas existentes y los requisitos para identificar problemas de seguridad en paquetes de Python del mundo real. A través de una revisión empírica de las principales vulnerabilidades de código abierto (CWE), evaluamos las limitaciones de las herramientas de detección actuales y destacamos la necesidad de futuras mejoras.

Takeaways, Limitations

Takeaways:
PyVul, el primer punto de referencia de vulnerabilidades de paquetes de Python preciso y a gran escala
Identificación de diferentes tipos de vulnerabilidades de paquetes de Python y su correlación multilingüe
Presentar las limitaciones de rendimiento y la necesidad de mejora de las herramientas de detección de vulnerabilidades existentes.
Los paquetes de Python multilingües presentan un mayor riesgo de vulnerabilidad
Limitations:
Los datos de vulnerabilidades de PyVul se limitan a las reportadas públicamente y verificadas por los desarrolladores. Es posible que las vulnerabilidades no descubiertas no se reflejen.
Debido a las limitaciones del método de limpieza de datos basado en LLM, la precisión a nivel de función no es del 100 % (94 %).
Falta de descripción detallada de los tipos y limitaciones de los detectores de última generación utilizados en el análisis.
Falta de propuestas específicas sobre futuras direcciones de desarrollo.
👍