Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

CEHR-XGPT: Un modelo escalable multitarea para la gestión de historiales clínicos electrónicos

Revelando la respuesta de los grandes modelos de visión y lenguaje a los elementos visualmente ausentes

Estrategias de aprendizaje adaptativo para la clasificación de figuras mitóticas en el desafío MIDOG2025

MitoDetect++: Un sistema robusto de dominio para la detección de mitosis y la subtipificación atípica

Alinear-Luego-Avanzar: Adaptación de los modelos de visión-lenguaje-acción mediante una guía latente unificada

Optimizadores fantásticos de preentrenamiento y dónde encontrarlos

Hacia una geolocalización interpretable: un marco de alineación de imágenes-GPS global que tiene en cuenta los conceptos

TECP: Predicción conforme de entropía de tokens para LLM

La trampa de la complejidad: el enmascaramiento simple de observaciones es tan eficiente como el resumen LLM para la gestión del contexto del agente

Planificación del movimiento cinedinámico mediante árboles de difusión

Equidad alineada con las habilidades en el aprendizaje multiagente para la colaboración en el sector sanitario

Mitigación de alucinaciones en modelos TTS basados en LM mediante la alineación de distribución con GFlowNets

AgentArmor: Aplicación del análisis del programa en el seguimiento del tiempo de ejecución del agente para protegerse contra la inyección de mensajes

HuggingGraph: Comprensión de la cadena de suministro del ecosistema LLM

Tendencias de seguridad alimentaria en Europa: información extraída de la base de datos Comprehensive European Food Safety (CHEFS), con 392 millones de entradas

Simple pero efectivo: un enfoque basado en la teoría de la información para la cuantificación de la incertidumbre de múltiples LLM

BayesSDF: Estimación de la incertidumbre laplaciana basada en superficies para geometría 3D con campos de distancias neuronales con signo

Potenciar los gemelos digitales puente mediante la reducción de la brecha de datos con un marco de síntesis unificado

El teorema de características en convergencia: una alternativa de primeros principios al Ansatz de características neuronales para explicar cómo las redes aprenden representaciones

Generación rápida de estructuras cristalinas asistida por IA para un entorno local objetivo

Primeros pasos para escuchar a los agentes de LLM: un estudio de caso con la jugabilidad de Dungeons & Dragons

TokUR: Estimación de la incertidumbre a nivel de token para el razonamiento de modelos de lenguaje extensos

Atravesando la privacidad: un ataque de reconstrucción de datos basado en hiperplanos en el aprendizaje federado

AutoPDL: Optimización automática de mensajes para agentes LLM

RailGoerl24: Conjunto de datos CV del Centro de Pruebas Ferroviarias de G\"orlitz 2024

Revelación de representaciones neuronales de orden superior de la incertidumbre con el modelo de Estimación de Ruido mediante Difusión Basada en Refuerzo (NERD)

PromptGuard: Moderación de contenido inseguro guiada por indicaciones suaves para modelos de texto a imagen

Descubrimiento de rastros de suplantación de identidad para la lucha contra la suplantación de identidad facial explicable basada en aprendizaje profundo

La conciencia de seguridad de la información de los grandes modelos lingüísticos

Detección automática de patrones engañosos en línea

HyperAgent: Agentes de ingeniería de software generalistas para resolver tareas de codificación a escala

Detección automatizada de enfermedades infradiagnosticadas mediante imágenes oportunistas

Optimización de preferencias selectivas mediante la estimación de la función de recompensa a nivel de token

ATHAR: Un conjunto de datos diverso y de alta calidad para la traducción del árabe clásico al inglés

PersonaGym: Evaluación de agentes Persona y LLM

CFaults: Diagnóstico basado en modelos para la localización de fallos en programas C con múltiples casos de prueba

De Frege a chatGPT: Composicionalidad en el lenguaje, la cognición y las redes neuronales profundas

AnyGPT: LLM multimodal unificado con modelado de secuencias discretas

Desmitificando cadenas, árboles y gráficos de pensamientos

Análisis de supervivencia con regularización adversarial

Net2Brain: Una caja de herramientas para comparar modelos de visión artificial con las respuestas del cerebro humano

La ilusión de la personalidad: revelando la disociación entre los autoinformes y el comportamiento en los LLM

PersonaTeaming: Explorando cómo la introducción de Personas puede mejorar la automatización de los equipos rojos de IA

Informe técnico de UI-TARS-2: Mejora del agente de interfaz gráfica de usuario con aprendizaje de refuerzo multiturno

Planificación dinámica de agentes especulativos

AI-SearchPlanner: Búsqueda agenética modular mediante aprendizaje de refuerzo multiobjetivo óptimo de Pareto

Gráfico RAG como modelo de elección humana: construcción de un agente de movilidad basado en datos con cadena de preferencias

MHSNet: una red de representación semántica jerárquica basada en MoE para la detección precisa de currículums duplicados con un modelo de lenguaje amplio

FutureX: Un punto de referencia avanzado en vivo para agentes LLM en predicción de futuro

MeLA: Una arquitectura metacognitiva impulsada por LLM para el diseño heurístico automático

Educación conversacional a escala: un flujo de trabajo multi-LLM para el aprendizaje procedimental y la evaluación de la calidad pedagógica

DiMo-GUI: Mejora del escalado en tiempo de prueba en la puesta a tierra de la GUI mediante razonamiento visual con reconocimiento de modalidades

No lo inventes: cómo preservar la conciencia de la ignorancia en el perfeccionamiento de los estudios de LLM

Traducción de algoritmos de aprendizaje federado en Python a procesos CSP mediante ChatGPT

ArtRAG: Generación aumentada por recuperación con contexto estructurado para la comprensión de las artes visuales

Habilidades epistémicas: razonamiento sobre el conocimiento y el olvido

Avances en los agentes de GUI móviles: un enfoque basado en verificadores para la implementación práctica

Agentes GUI: una encuesta

Verificación de redes neuronales con PyRAT

Antídoto: Alineación de seguridad posterior al ajuste fino para modelos de lenguaje grandes contra el ajuste fino perjudicial

Integración de gráficos de conocimiento federados de baja dimensión mediante destilación de conocimiento

MMoE: Detección robusta de spoilers con información multimodal y combinación de expertos con conocimiento del dominio

WinT3R: Reconstrucción de transmisión basada en ventanas con grupo de tokens de cámara

Codificación cruzada a través del tiempo: seguimiento del surgimiento y la consolidación de representaciones lingüísticas durante la formación previa al LLM

Informe técnico de SpikingBrain: Modelos grandes inspirados en Spiking Brain

Rendimiento de escalado del preentrenamiento de modelos de lenguaje grandes

Recomposer: Edición de audio generativa guiada por eventos

COGITAO: Un marco de razonamiento visual para estudiar la composicionalidad y la generalización

Incierto pero útil: Aprovechar la variabilidad de las CNN para aumentar los datos

CURE: Desaprendizaje controlado para incrustaciones robustas: mitigación de atajos conceptuales en modelos de lenguaje preentrenados

HoPE: Codificación posicional rotatoria hiperbólica para el modelado de dependencias estables de largo alcance en modelos de lenguaje extensos

RapidGNN: Entrenamiento distribuido eficiente en energía y comunicación en redes neuronales de gráficos a gran escala

Mejora de la clasificación de nubes de puntos 3D con ModelNet-R y Point-SkipNet

Agentes de IA para pruebas web: un estudio de caso práctico

Poda de CNN con precisión limitada para una detección de convulsiones basada en EEG eficiente y confiable

Exploración de las estabilidades situadas de un sistema de generación de ritmo mediante el interrogatorio variacional

Generación y ejecución de casos de prueba basados en GenAI en la plataforma SDV

ICR: Aclaración y reescritura iterativa para la búsqueda conversacional

ToM-SSI: Evaluación de la teoría de la mente en interacciones sociales situadas

Hacia un etiquetado de píxeles eficiente para la detección y localización de anomalías industriales

Estimación de objetivos guiada por apuntamiento mediante atención basada en transformadores

Aumento Adversario y Muestreo Activo para una Detección Robusta de Anomalías Cibernéticas

Sistema multiagente habilitado por LLM para redes 6G: marco y método de colaboración de borde-terminal de doble bucle

Recuperación de la temperatura global de la superficie terrestre de alta resolución mediante un marco de aprendizaje automático y mecanismo acoplado

Explorando una implementación de un flujo de aprendizaje cuántico para máquinas de vectores de soporte

DeGuV: Aprendizaje de refuerzo visual guiado por profundidad para la generalización y la interpretabilidad en la manipulación

Inteligencia artificial para representar y caracterizar sistemas cuánticos

Informe técnico de PLaMo 2

SpiderNets: Estimación de índices de miedo de imágenes relacionadas con arañas mediante modelos de visión

La paradoja de la fatalidad: reconocer el riesgo de extinción reduce el incentivo para prevenirlo

Una política de difusión basada en el conocimiento para la conducción autónoma de extremo a extremo basada en rutas expertas

REMOTO: Un marco unificado de extracción de relaciones multimodales con transporte óptimo multinivel y mezcla de expertos

PropVG: Fundamentación visual integral basada en propuestas con discriminación multigranular

Exploración de correlaciones espacio-angulares no locales con un marco híbrido Mamba-Transformer para la superresolución del campo de luz

Compresión de enlaces fronthaul impulsada por IA en sistemas de comunicación inalámbrica: revisión y diseño de métodos

Hacia una dermatología accesible: clasificación de lesiones cutáneas mediante modelos de aprendizaje profundo en imágenes adquiridas mediante dispositivos móviles

Desaprendizaje de grafos: Eliminación eficiente de nodos en redes neuronales de grafos

Mejora de la diversidad en modelos lingüísticos grandes mediante procesos puntuales determinantes

Transformador mejorado con VARMA para la predicción de series temporales

El LLM ha abandonado el chat: evidencia de preferencias de fianza en modelos de lenguaje grandes

AgentArmor: Aplicación del análisis del programa en el seguimiento del tiempo de ejecución del agente para protegerse contra la inyección de mensajes

Created by

Haebom

Autor

Peiran Wang, Yang Liu, Yunfei Lu, Yifeng Cai, Hongbo Chen, Qingyou Yang, Jie Zhang, Jue Hong, Ye Wu

Describir

Este artículo presenta un enfoque novedoso para abordar las vulnerabilidades de seguridad en agentes de Modelos de Lenguaje a Gran Escala (LLM), en particular el riesgo de ataques de inyección rápida, mediante el tratamiento de las trazas de ejecución de los agentes como programas estructurados. Proponemos un marco de análisis de programas, AgentArmor, que transforma las trazas de los agentes en representaciones intermedias de grafos (CFG, DFG, PDG, etc.) e implementa políticas de seguridad mediante un sistema de tipos. AgentArmor consta de tres componentes principales: un generador de grafos, un registro de propiedades y un sistema de tipos. Al representar el comportamiento del agente como un programa estructurado, permite el análisis de programas para flujos de datos sensibles, límites de confianza e infracciones de políticas. Los resultados de la evaluación realizada con el benchmark AgentDojo demuestran que AgentArmor reduce la ASR al 3 % y limita la degradación de la utilidad al 1 %.

Takeaways, Limitations

•

Takeaways:

◦

Proporcionar una solución eficaz al problema de vulnerabilidad de seguridad de los agentes LLM.

◦

Permite el uso de técnicas de análisis estático al convertir los seguimientos de ejecución del agente en programas estructurados para su análisis.

◦

AgentArmor puede ayudar a reducir las amenazas de seguridad causadas por ataques de inyección rápida.

◦

Los resultados experimentales verifican la eficacia y practicidad de AgentArmor.

•

Limitations:

◦

Se necesita más investigación sobre el rendimiento y la eficacia de AgentArmor.

◦

Se requiere verificación de aplicabilidad para varios tipos de agentes y entornos LLM.

◦

Necesidad de verificar la precisión y las limitaciones del análisis del comportamiento de agentes complejos

◦

Necesidad de evaluar la adaptabilidad a nuevos tipos de ataques o diseños de agentes

Ver PDF

Made with Slashpage