Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

MoSEs: Detección de texto generada por IA con conocimiento de la incertidumbre mediante la combinación de expertos en estilística con umbrales condicionales

Decodificación de evitación para la generación de historias diversas de múltiples ramas

HydroVision: Predicción de parámetros ópticamente activos en aguas superficiales mediante visión artificial

HodgeFormer: Transformadores para operadores aprendibles en mallas triangulares mediante matrices de Hodge basadas en datos

MSA2-Net: Utilización de un módulo de convolución autoadaptativo para extraer información multiescala en la segmentación de imágenes médicas

Recableado adaptativo impulsado por Q-Learning para el control cooperativo en redes heterogéneas

Spotlighter: Revisando el ajuste de indicaciones desde una perspectiva de minería representativa

RAG iterativo multimodal para la respuesta visual a preguntas de conocimiento

IA encarnada: riesgos emergentes y oportunidades para la acción política

El metaaprendizaje de antecedentes ecológicos a partir de grandes modelos lingüísticos explica el aprendizaje y la toma de decisiones humanos

Difusión de andamios: generación de estructuras de vóxeles dispersas de múltiples categorías con difusión discreta

Locus: Síntesis de predicados agentes para fuzzing dirigido

Indicadores a nivel de red y fugas de rasgos en agentes de investigación locales

La dinámica de la información de la difusión generativa

Redes neuronales ternarias impresas con precisión arbitraria y aproximación evolutiva holística

Murakkab: Orquestación de flujos de trabajo de agentes eficiente en el uso de recursos en plataformas de nube

LinkAnchor: un agente autónomo basado en LLM para la recuperación de enlaces de emisión a confirmación

MoNaCo: Preguntas más naturales y complejas para razonar a través de decenas de documentos

STREAM (ChemBio): Un estándar para la presentación transparente de informes de evaluaciones en informes de modelos de IA

BadPromptFL: Una nueva amenaza de puerta trasera para el aprendizaje federado basado en indicaciones en modelos multimodales

Aprendiendo a seleccionar algoritmos MCP: del aprendizaje automático tradicional al GAT-MLP de doble canal

MagicGUI: un agente GUI móvil fundamental con canalización de datos escalable y ajuste de refuerzo

Una capa neurosimbólica inspirada en DbC para el diseño de agentes confiables

RoboMemory: Un marco de trabajo multimemoria basado en la agencia para el aprendizaje permanente en sistemas físicos encarnados.

LanternNet: un sistema de concentrador y radios para buscar y eliminar poblaciones de moscas linterna moteadas

¿Cuándo y dónde atacan los venenos de datos la inversión textual?

Cubriendo algunas restricciones y aplicaciones submodulares

Repensando la protección de datos en la era de la inteligencia artificial (generativa)

LD-RPS: Restauración unificada de imágenes de disparo cero mediante muestreo posterior recurrente por difusión latente

GroundingDINO-US-SAM: Segmentación multiorgánica basada en texto en ultrasonido con modelos de visión y lenguaje optimizados para LoRA

IndexTTS2: Un avance en la conversión de texto a voz autorregresiva de cero disparos, emocionalmente expresiva y con control de duración.

HERCULES: Agrupamiento recursivo basado en incrustación jerárquica mediante LLM para un resumen eficiente

Vinculación de imágenes médicas multimodales mediante incrustaciones de texto compartidas

Segmentación panóptica LiDAR de conjunto abierto guiada por aprendizaje consciente de la incertidumbre

Revisando la agrupación de bandidos neuronales: reinicialización selectiva para mitigar la pérdida de plasticidad

Atribución basada en incrustación (LEA) de LLM: cuantificación de las contribuciones de las fuentes a la respuesta del modelo generativo para el análisis de vulnerabilidades

Un marco teórico para el aprendizaje contrastivo autosupervisado para datos dependientes continuos

Protección de agentes de IA mediante el control del flujo de información

FastCache: Almacenamiento rápido en caché para transformadores de difusión mediante aproximación lineal aprendible

Cog-TiPRO: Refinamiento iterativo de indicaciones con LLM para detectar el deterioro cognitivo mediante comandos longitudinales del asistente de voz

Descubra descripciones de múltiples imágenes para la detección del deterioro cognitivo leve multilingüe mediante aprendizaje contrastivo

NOVER: Entrenamiento de incentivos para modelos lingüísticos mediante aprendizaje de refuerzo sin verificador

Cuando un agente de aprendizaje de refuerzo se encuentra con incógnitas desconocidas

Optimización de políticas de grupo dentro de grupo para la capacitación de agentes LLM

Análisis automatizado de planos de ingeniería para la extracción de información estructurada mediante un transformador de comprensión de documentos optimizado

LawFlow: Recopilación y simulación de procesos de pensamiento de abogados sobre casos prácticos de constitución de empresas

Sobre la autodeclaración de los desarrolladores de código generado por IA: un análisis de las prácticas

WildFireCan-MMD: Un conjunto de datos multimodales para la clasificación de contenido generado por el usuario durante incendios forestales en Canadá

Hacia los modelos básicos de resonancia magnética cardíaca: representaciones visuales y tabulares integrales para la evaluación de todo el corazón y más allá

HDVIO2.0: Estimación de viento y perturbaciones con Hybrid Dynamics VIO

TruthLens: Base visual para el razonamiento universal sobre deepfakes

Impoola: El poder de la agrupación de promedios para el aprendizaje de refuerzo profundo basado en imágenes

Edición eficiente de modelos de mezcla de expertos con expertos comprimidos

¿Problema resuelto? Espacio de diseño de extracción de información para documentos con maquetación enriquecida mediante LLM.

Investigación de un enfoque independiente del modelo y libre de imputación para el modelado de series temporales multivariadas con muestreo irregular

Aprendizaje rápido de palabras mediante el aprendizaje meta en contexto

FedP$^2$EFT: Aprendizaje federado para personalizar PEFT para LLM multilingües

Predecir, agrupar, refinar: un marco predictivo autosupervisado de integración conjunta para el aprendizaje de la representación gráfica

Encuesta sobre el reconocimiento de gestos de las manos a partir de información visual

Autorreflexión guiada por la atención para la detección de alucinaciones de disparo cero en modelos lingüísticos de gran tamaño

RouteNet-Gauss: Modelado de redes mejorado por hardware con aprendizaje automático

GalaxAlign: Imitando la guía multimodal de los científicos ciudadanos para el análisis de la morfología de galaxias

Soft-TransFormers para el aprendizaje continuo

Explorando la incertidumbre de la respuesta en los MLLM: una evaluación empírica bajo escenarios engañosos

TreeBoN: Mejora de la alineación en el tiempo de inferencia con búsqueda de árboles especulativa y muestreo del mejor de N

Aprendizaje de la representación de la consistencia del dominio para la reidentificación de la persona a lo largo de la vida

Alineación de representaciones visuales humanas y de máquinas en todos los niveles de abstracción

Hacia una IA agente en aceleradores de partículas

Mejora del rendimiento de la inferencia del lenguaje natural con Knowledge Graph para la verificación automatizada de datos sobre la COVID-19 en idioma indonesio.

Mooncake: una arquitectura desagregada centrada en KVCache para el servicio LLM

Para eliminar las alucinaciones de LLM es necesario repensar la generalización

SampleAttention: Aceleración casi sin pérdidas de la inferencia LLM de contexto largo con atención dispersa estructurada adaptativa

MF-OML: Aprendizaje de refuerzo de campo medio en línea con medidas de ocupación para juegos de gran población

Marco explicable de seguridad y protección de la privacidad basado en aprendizaje automático para sistemas de Internet de las cosas médicas

De las métricas al significado: es hora de repensar la evaluación en el diseño colaborativo entre humanos e IA

P2DT: Mitigación del olvido en el aprendizaje incremental de tareas con un transformador de decisión progresivo y rápido

Hacia Agentic OS: Un marco de agente LLM para programadores de Linux

CoreThink: una capa de razonamiento simbólico para razonar sobre tareas de horizonte largo con LLM

ChatCLIDS: Simulación de diálogos persuasivos con IA para promover la adopción de insulina en circuito cerrado en la atención de la diabetes tipo 1

L-MARS: Flujo de trabajo multiagente legal con razonamiento orquestado y búsqueda agéntica

AHELM: Una evaluación holística de los modelos de audio-lenguaje

La máquina pensante de Ramon Llull para la ideación automatizada

Asignación de créditos basada en búsquedas para el aprendizaje de refuerzo basado en preferencias fuera de línea

KIRETT: Asistente de tratamiento inteligente basado en gráficos de conocimiento para operaciones de rescate inteligentes

CoT-Self-Instruct: Creación de indicaciones sintéticas de alta calidad para tareas de razonamiento y no razonamiento

Integración de predicciones de actividad en gráficos de conocimiento

Agentes simbióticos: un nuevo paradigma para redes confiables impulsadas por IA general

ChordPrompt: Orquestando la sinergia de indicaciones intermodales para el aprendizaje incremental multidominio en CLIP

Agentes de investigación profunda: un examen sistemático y una hoja de ruta

Gradientes: Cuando los mercados se encuentran con el ajuste fino: un enfoque distribuido para la optimización de modelos

ORMind: Un marco de razonamiento integral de inspiración cognitiva para la investigación de operaciones

Agentes apagables a través de POST-Agencia

CyberBOT: Hacia una educación confiable en ciberseguridad mediante la generación aumentada de recuperación basada en ontologías

PadChest-GR: Un conjunto de datos bilingüe de rayos tórax X para la generación de informes de radiología basados en la tierra

¿Pueden los modelos de lenguaje grandes actuar como ensambladores para múltiples GNN?

MorphAgent: Empoderamiento de agentes mediante perfiles autoevolutivos y colaboración descentralizada

Inferencia frugal para el control

Sobre la generación de explicaciones monolíticas y de conciliación de modelos en escenarios probabilísticos

Una encuesta sobre la colaboración entre humanos e IA con grandes modelos de cimentación

JARVIS: Un marco de razonamiento neurosimbólico de sentido común para agentes conversacionales encarnados

Atribución basada en incrustación (LEA) de LLM: cuantificación de las contribuciones de las fuentes a la respuesta del modelo generativo para el análisis de vulnerabilidades

Created by

Haebom

Autor

Reza Fayyazi, Michael Zuzak, Shanchieh Jay Yang

Describir

Este documento aborda los problemas de confiabilidad y seguridad de los modelos de lenguaje a gran escala (LLM), que se utilizan cada vez más en el análisis de amenazas de ciberseguridad. Con más de 21,000 vulnerabilidades reveladas solo en 2025, el análisis manual es imposible, y el soporte de IA escalable y verificable es crucial. Los LLM tienen dificultades para abordar las vulnerabilidades emergentes debido a las limitaciones de sus datos de entrenamiento. La Generación Aumentada por Recuperación (RAG) puede mitigar estas limitaciones al proporcionar información actualizada, pero sigue sin estar claro en qué medida los LLM dependen de la información recuperada y si esta es significativa y precisa. Esta incertidumbre puede confundir a los analistas de seguridad, lo que lleva a una priorización incorrecta de parches y a un aumento de los riesgos de seguridad. Por lo tanto, este documento propone la Atribución basada en la Integración de LLM (LEA) para analizar las respuestas generadas para el análisis de explotación de vulnerabilidades. LEA cuantifica las contribuciones relativas del conocimiento interno y el contenido recuperado en la respuesta generada. Utilizando tres LLM de vanguardia, evaluamos LEA en tres configuraciones de RAG (válida, genérica e incorrecta) frente a 500 vulnerabilidades críticas descubiertas entre 2016 y 2025. Los resultados demuestran que LEA puede detectar diferencias claras entre escenarios de no descubrimiento, genéricos y de descubrimiento válido con una precisión superior al 95 % en un modelo a gran escala. Finalmente, demostramos las limitaciones de recuperar información incorrecta sobre vulnerabilidades y advertimos a la comunidad de ciberseguridad contra la confianza ciega en LLM y RAG para el análisis de vulnerabilidades. LEA proporciona a los analistas de seguridad métricas para auditar el flujo de trabajo mejorado de RAG, lo que mejora la transparencia y la fiabilidad de la implementación de la IA en el análisis de amenazas de ciberseguridad.

Takeaways, Limitations

•

Takeaways:

◦

La atribución basada en incrustación de LLM (LEA) presenta un método para aumentar la confiabilidad mediante el análisis cuantitativo de la contribución del conocimiento interno y la información recuperada en las respuestas de LLM basadas en RAG.

◦

Validamos experimentalmente RAG con una alta precisión de más del 95% y demostramos que puede detectar la recuperación de información errónea.

◦

Proporciona pautas prácticas para la implementación transparente y confiable de la IA en el análisis de amenazas de ciberseguridad.

•

Limitations:

◦

Es imposible eliminar por completo la posibilidad de errores debido a la recuperación incorrecta de información.

◦

Se necesita más investigación para determinar la generalización del conjunto de 500 datos de vulnerabilidad utilizado en la evaluación.

◦

Se necesita más investigación sobre el desempeño de generalización de LEA a varios sistemas LLM y RAG.

Ver PDF

Made with Slashpage