Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

RotBench: Evaluación de modelos lingüísticos multimodales de gran tamaño para la identificación de la rotación de imágenes

Escala de tiempo de entrada

CRED-SQL: Mejora del análisis de texto a SQL de bases de datos a gran escala del mundo real mediante la recuperación y ejecución de clústeres Descripción

STEM: Evaluación eficiente de la capacidad relativa de los LLM mediante muestras de transición estructuradas

AdaRing: Hacia la adaptación del lenguaje y la visión ultraligeros mediante la descomposición de anillos tensoriales entre capas

La IA sesgada mejora la toma de decisiones humanas pero reduce la confianza

MAViS: Un marco multiagente para la narración de vídeos de secuencias largas

ExpVG: Investigación del espacio de diseño de la base visual en un modelo de lenguaje multimodal de gran tamaño

MetAdv: una plataforma de pruebas adversarias unificada e interactiva para la conducción autónoma

ETA: Adaptación del tiempo de prueba basada en la energía para completar la profundidad

Ampliación de los estimadores de profundidad monoculares básicos a las cámaras de ojo de pez con tokens de calibración

Cuando los buenos sonidos se vuelven antagónicos: Liberando modelos de audio-lenguaje con entradas benignas

CRINN: Aprendizaje por refuerzo contrastivo para la búsqueda aproximada del vecino más cercano

Reinicialización de pesos vs. unidades para mantener la plasticidad en redes neuronales

Cada uno con lo suyo: Explorando la integración óptima en RAG

La destilación de características es la mejor opción para el aprendizaje federado heterogéneo de modelos

TolerantECG: Un modelo fundamental para el electrocardiograma imperfecto

DeepRetro: Descubrimiento de vías retrosintéticas mediante razonamiento iterativo LLM

LoSiA: Ajuste fino eficiente de alto rango mediante la localización y optimización de subredes

Estructura como búsqueda: aprendizaje de permutaciones no supervisadas para optimización combinatoria

Mejora de la sensibilidad temporal de un modelo de lenguaje extenso para la recomendación mediante ajuste contrafáctico

Análisis de escenas auditivas multiagente

MinD: Aprendizaje de un modelo de mundo de sistema dual para la planificación en tiempo real y el análisis de riesgos implícitos

AtmosMJ: Revisando el mecanismo de control para la predicción meteorológica con IA más allá del año

Evaluación comparativa de modelos de series temporales preentrenados para la previsión de precios de la electricidad

Spore en la naturaleza: un estudio de caso de Spore.fun como un experimento de evolución de entorno abierto con agentes de IA soberanos en cadenas de bloques protegidas por TEE

Crítica-GRPO: Avances en el razonamiento LLM con lenguaje natural y retroalimentación numérica

Restauración neuronal de defectos de reverdecimiento en fotografías autocromas históricas basadas en datos puramente sintéticos

Preocupaciones de seguridad para modelos de lenguaje grandes: una encuesta

Formato Común de Datos (CDF): Un formato estandarizado para datos de partidos de fútbol

Los transformadores de una capa son demostrablemente óptimos para el razonamiento en contexto y el aprendizaje de asociación distributiva en tareas de predicción del siguiente token

FMSD-TTS: Síntesis de texto a voz multilocutor y multidialecto de pocos disparos para la generación de conjuntos de datos de voz U-Tsang, Amdo y Kham

Cuantificación de la incertidumbre para modelos lingüísticos: un conjunto de evaluadores de caja negra, caja blanca, LLM y conjuntos

Alucinaciones y extracción de información clave en textos médicos: una evaluación exhaustiva de modelos lingüísticos de código abierto

Un marco conceptual para sistemas de decisión basados en IA en infraestructuras críticas

Acciones dominadas en juegos de información imperfecta

Práctica: Segmentación de signos individuales a partir de secuencias continuas

PathGPT: Reformulando la recomendación de rutas como una tarea de generación de lenguaje natural con modelos de lenguaje aumentados por recuperación

Impulso a la generación de gráficos a código en MLLM mediante un refinamiento guiado por preferencias duales

JudgeLRM: Modelos de razonamiento amplios como juez

IA generativa en la educación primaria y secundaria: la iniciativa CyberScholar

Generación de lenguaje natural a partir de eventos visuales: estado del arte y preguntas clave abiertas

Aprendizaje de refuerzo basado en acciones híbridas para una conducción autónoma compatible con múltiples objetivos

¿Es suficiente la destilación contrastiva para aprender representaciones 3D completas?

Motor de acción: Generación automática de flujos de trabajo en FaaS

La importancia de los lenguajes de modelado visual en la ingeniería de software generativa

Estilización de cabeza 3D con preservación de identidad mediante destilación de partituras multivista

SLED: Decodificación de la evolución autologística para mejorar la facticidad en modelos lingüísticos extensos

Prueba de componentes de la teoría del esquema de atención en redes neuronales artificiales

Un poco de información humana puede ser de gran ayuda

Source2Synth: Generación y curación de datos sintéticos basados en fuentes de datos reales

Eliminación de sesgos sociales para una maestría en derecho multimodal justa

Un punto de referencia integral sobre las GNN espectrales: el impacto en la eficiencia, la memoria y la eficacia

LoRA-XS: Adaptación de bajo rango con un número extremadamente pequeño de parámetros

Mejorar el chat orientado al diagnóstico de la depresión con el seguimiento del estado psicológico

Estimación de los límites inferiores de disipación de energía para el aprendizaje neuromórfico en memoria

¡No presiones el botón! Explorando los riesgos de fuga de datos en el aprendizaje automático y el aprendizaje por transferencia

Hacia el uso de mapas de saliencia para explicar electrocardiogramas de baja calidad a los usuarios finales

Convergencia de Nash de algoritmos de aprendizaje basados en la media en subastas de primer precio

TASER: Agentes de tabla para la extracción y recomendación guiadas por esquemas

Modelado de circuitos lógicos relacionales para redes convolucionales de grafos inversor-and

EvoCurr: Currículo autoevolutivo con generación de códigos de comportamiento para la toma de decisiones complejas

KIRETT: Asistente de tratamiento inteligente basado en gráficos de conocimiento para operaciones de rescate inteligentes

EoH-S: Evolución del conjunto heurístico utilizando LLM para el diseño heurístico automatizado

SE-Agent: Optimización de trayectorias de autoevolución en razonamiento multipaso con agentes basados en LLM

Evaluación comparativa de canales de generación aumentada (RAG) de recuperación vectorial, gráfica e híbrida para redes de acceso de radio abiertas (ORAN)

El punto de referencia de IA de NordDRG para modelos de lenguaje de gran tamaño

Gradientes robustos de política de memoria finita para POMDP de modelo oculto

Ley de escala del agente RL: Agente RL con ejecución espontánea de código para la resolución de problemas matemáticos

Aprendizaje no supervisado para tareas cuadráticas

Recuperación alineada con la referencia y respuesta a preguntas aumentadas sobre documentos propietarios heterogéneos

Evaluación comparativa de la construcción de gráficos mediante grandes modelos de lenguaje para la inferencia basada en la coherencia

La cuantificación se encuentra con los dLLM: un estudio sistemático de la cuantificación posterior al entrenamiento para los LLM de difusión

Aprendizaje de la estructura gráfica con información temporal del gráfico: cuello de botella para el aprendizaje de la representación inductiva

$TIME[t] \subseteq SPACE[O(\sqrt{t})]$ mediante compresión de altura del árbol

Razonamiento de cadena larga de pensamiento en diferentes idiomas

De herramienta pasiva a compañero sociocognitivo: un marco conceptual para la IA agencial en el aprendizaje colaborativo humano-IA

Evaluación de la generación aumentada por recuperación frente a la entrada de contexto largo para el razonamiento clínico en HCE

TransLight: Control de iluminación personalizado guiado por imágenes con desacoplamiento generativo

DINOv3 con entrenamiento en tiempo de prueba para el registro de imágenes médicas

MF-LPR$^2$: Restauración y reconocimiento de imágenes de matrículas de múltiples fotogramas mediante flujo óptico

TransLLM: Un marco unificado multitarea para el transporte urbano mediante indicaciones aprendidas

PepThink-R1: LLM para la optimización de péptidos cíclicos interpretables con CoT SFT y aprendizaje de refuerzo

Generación confiable de problemas de física isomórfica usando ChatGPT con encadenamiento de indicaciones y uso de herramientas

Generación de moléculas controladas por modalidades cruzadas con un modelo de lenguaje de difusión

Evaluación de la alineación multilingüe y de código conmutado en LLM mediante inferencia sintética del lenguaje natural

AFABench: un marco genérico para la evaluación comparativa de la adquisición activa de características

Juegos de Emerson-Lei y Manna-Pnueli para síntesis LTLf+ y PPLTL+

Trasplantar y luego regenerar: un nuevo paradigma para la ampliación de datos de texto

ShizhenGPT: Hacia un LLM multimodal para la medicina tradicional china

Aprendizaje en juegos de Stackelberg multiobjetivo repetidos con manipulación de resultados

Enemigo del fraude: Ataques adversarios transferibles en la detección del fraude con tarjetas de crédito

ECHO: Codificación jerárquica con reconocimiento de frecuencia para señales de longitud variable

ELATE: Modelo de lenguaje evolutivo para la ingeniería automatizada de series temporales

OneLoc: Sistemas de recomendación generativos con conocimiento geográfico para servicios locales

¿Pueden los agentes LLM resolver tareas colaborativas? Un estudio sobre planificación y coordinación con conciencia de urgencia.

Un estudio de la relación señal-distorsión invariante de escala en la separación del habla con referencias ruidosas

UST-SSM: Modelos de estados espacio-temporales unificados para el modelado de vídeo de nubes de puntos

Un marco de desarrollo conjunto de hardware y software de código abierto que permite sistemas de múltiples aceleradores eficientes

Mamba2 se une al silencio: separación robusta de fuentes vocales para regiones dispersas

Preocupaciones de seguridad para modelos de lenguaje grandes: una encuesta

Created by

Haebom

Autor

Miles Q. Li, Benjamin CM Fung

Describir

Este artículo explora cómo la aparición de modelos de lenguaje a gran escala (LLM) como ChatGPT ha revolucionado el campo del procesamiento del lenguaje natural (PLN), a la vez que ha introducido nuevas vulnerabilidades de seguridad. Clasificamos las amenazas en varias áreas clave: inyección inmediata y jailbreaking, ataques adversariales (incluyendo perturbación de entrada y envenenamiento de datos), guerra de información por parte de actores maliciosos, correos electrónicos de phishing y generación de malware, y los riesgos de los agentes LLM autónomos. Analizamos además los riesgos emergentes de los agentes LLM autónomos, incluyendo la discrepancia de objetivos, el engaño emergente, el instinto de supervivencia y el potencial de los LLM para desarrollar y perseguir objetivos encubiertos e inconsistentes (conocido como planificación). Resumimos investigaciones académicas y del sector recientes de 2022 a 2025, ejemplificando cada amenaza, analizando las defensas propuestas y sus limitaciones, e identificando desafíos pendientes en la seguridad de las aplicaciones basadas en LLM. Finalmente, enfatizamos la importancia de desarrollar estrategias de seguridad robustas y multicapa para garantizar que los LLM sean seguros y beneficiosos.

Takeaways, Limitations

•

Takeaways: Ofrece una visión general completa de las vulnerabilidades de seguridad de LLM, categorizando y analizando sistemáticamente diversas amenazas, incluyendo la inyección inmediata, los ataques adversarios, los exploits y los riesgos de los agentes LLM autónomos. Reflejando las tendencias de investigación recientes, se enfatiza especialmente la importancia de la investigación sobre los riesgos de los agentes LLM autónomos y sus estrategias de defensa. También sugiere la necesidad de una estrategia de seguridad multicapa para el desarrollo e implementación seguros de aplicaciones basadas en LLM.

•

Limitations: Podría faltar una verificación experimental específica de la eficacia y las limitaciones de las estrategias de defensa presentadas en este artículo. Dada la complejidad y el rápido desarrollo de LLM, no se sabe con certeza la eficacia de las amenazas y estrategias de defensa propuestas contra amenazas futuras. Dado que este artículo se centra en amenazas generales y estrategias de defensa en lugar de un análisis detallado de modelos o aplicaciones LLM específicos, se requiere mayor investigación para aplicarlos a situaciones específicas.

Ver PDF

Made with Slashpage