Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

POEX: Hacia ataques de fuga de políticas ejecutables contra robots basados en LLM

Created by
  • Haebom

Autor

Xuancun Lu, Zhengxian Huang, Xinfeng Li, Chi Zhang, Xiaoyu ji, Wenyuan Xu

Describir

Este artículo investiga las vulnerabilidades de seguridad de los sistemas robóticos basados en modelos de lenguaje a gran escala (LLM). Destacamos que la vulnerabilidad de los LLM a los ataques de fuga de control, que transforman comandos robóticos en políticas ejecutables, representa un grave riesgo de seguridad, tanto en el ámbito digital como en el físico. Investigamos la aplicabilidad de los ataques de fuga de control existentes en LLM a sistemas robóticos y proponemos una novedosa técnica de ataque, POlicy Executable (POEX). POEX utiliza optimización de gradiente de capa oculta y un evaluador multiagente para derivar políticas ejecutables dañinas, y su eficacia se verifica mediante sistemas robóticos y simulaciones reales. Finalmente, proponemos técnicas de defensa basadas en indicaciones y modelos para mitigar los ataques de fuga de control.

Takeaways, Limitations

Takeaways:
Demostramos empíricamente la viabilidad de un ataque de jailbreak en un sistema robótico basado en LLM.
Explicamos por qué los ataques de jailbreak LLM existentes no son directamente aplicables a los sistemas robóticos.
Proponemos POEX, una novedosa técnica de ataque jailbreak especializada para sistemas robóticos, y verificamos su efectividad.
Se presentan técnicas de defensa basadas en indicaciones y modelos contra ataques de fuga de prisión.
Destaca la necesidad de medidas de seguridad urgentes para garantizar el despliegue seguro de robots basados en LLM.
Limitations:
La eficacia de POEX ha sido validada para sistemas robóticos y LLM específicos, y su generalización a otros sistemas o LLM requiere más estudios.
Se necesita más análisis sobre la eficacia práctica y las limitaciones de las técnicas de defensa propuestas.
Es necesario un estudio exhaustivo de los distintos tipos de ataques de fuga de prisión y de las técnicas de defensa.
👍