Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Pruebas de penetración basadas en inteligencia artificial generativa: una comparación entre Claude Opus, GPT-4 y Copilot

Created by
  • Haebom

Autor

Antonio López Martínez, Alejandro Cano, Antonio Ruiz- Martínez

Describir

Este artículo evalúa la eficacia de las pruebas de penetración (pentesting) mediante herramientas de inteligencia artificial generativa (GenAI) (Claude Opus, GPT-4, Copilot). Se realizaron experimentos en un entorno virtual en cada etapa del Estándar de Ejecución de Pruebas de Penetración (PTES). Si bien las herramientas GenAI no pueden automatizar todo el proceso de pentesting, sí mejoran significativamente la eficiencia y la eficacia de tareas específicas. Claude Opus, en particular, superó a otras herramientas.

Takeaways, Limitations

Takeaways:
Demostramos empíricamente que las herramientas GenAI pueden respaldar eficientemente el proceso de prueba de penetración.
Confirmar la excelencia de una herramienta GenAI específica (Claude Opus) y contribuir a establecer futuras estrategias de selección y utilización de herramientas.
Proponer un plan para utilizar GenAI para mejorar y automatizar el proceso de prueba de penetración.
Limitations:
Las herramientas GenAI limitadas y los entornos experimentales dificultan la generalización.
La automatización completa de pruebas de penetración con herramientas GenAI aún no es posible.
Existe la posibilidad de que surjan problemas inesperados al aplicarlo en un entorno real.
👍