Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
LinguaSafe: un referente integral de seguridad multilingüe para modelos lingüísticos de gran tamaño
Created by
Haebom
Autor
Zhiyuan Ning, Tianle Gu, Jiaxin Song, Shixin Hong, Lingyu Li, Huacan Liu, Jie Li, Yixu Wang, Meng Lingyu, Yan Teng, Yingchun Wang
Describir
Este artículo se centra en garantizar la seguridad de los modelos lingüísticos a gran escala (LLM) en diversos contextos lingüísticos y culturales. Para abordar la falta de evaluaciones exhaustivas y datos diversos para las evaluaciones de seguridad de los LLM multilingües existentes, presentamos LinguaSafe, un punto de referencia de seguridad multilingüe que comprende 45.000 ítems en 12 idiomas, desde el húngaro hasta el malayo. Desarrollado mediante la combinación de traducciones, traducciones de variantes y datos fuente, LinguaSafe proporciona un marco de evaluación multidimensional y granular que incluye evaluaciones de seguridad directas e indirectas, así como una evaluación adicional de hipersensibilidad. Demostramos que los resultados de las evaluaciones de seguridad y usabilidad varían significativamente entre idiomas y dominios, lo que destaca la importancia de la evaluación de seguridad de los LLM multilingües. El conjunto de datos y el código se distribuyen abiertamente para apoyar futuras investigaciones.
Takeaways, Limitations
•
Takeaways:
◦
Ofrecemos LinguaSafe, un punto de referencia integral para evaluar la seguridad de los LLM multilingües.
◦
Aborda los sesgos lingüísticos existentes al incluir varios idiomas (desde el húngaro hasta el malayo).
◦
Proporciona un marco de evaluación multidimensional que incluye evaluaciones de seguridad directas e indirectas.
◦
Los resultados de la evaluación de seguridad de los LLM multilingües muestran diferencias significativas entre idiomas y dominios.
◦
El conjunto de datos y el código publicados sientan las bases para futuras investigaciones sobre seguridad LLM multilingües.
•
Limitations:
◦
El tamaño y la cobertura lingüística del conjunto de datos de LinguaSafe se pueden ampliar aún más.
◦
Podría requerirse una validación adicional de la objetividad y confiabilidad del marco de evaluación.
◦
Es posible que todavía existan sesgos hacia determinados idiomas o contextos culturales.
◦
La adaptabilidad a nuevas arquitecturas y características LLM necesita más estudios.