Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

¿Qué impulsa la generalización compositiva en los modelos generativos visuales?

Umbralización consciente de la relevancia en la predicción conforme en línea para series temporales

MINERVA: Estimación neuronal de información mutua para la selección supervisada de características

Preentrenamiento con memorias jerárquicas: separando el conocimiento común y de cola larga

Más allá de manuales y tareas: aprendizaje contextual a nivel de instancia para agentes LLM

InfoMosaic-Bench: Evaluación de la búsqueda de información multifuente en agentes mejorados con herramientas

Comparación de la pérdida contrastiva y triplete: análisis de varianza y comportamiento de optimización

Generación de hallazgos para quistes mandibulares en radiografías panorámicas dentales mediante GPT-4o: construcción de un bucle de autocorrección de dos etapas con salida estructurada (SLSO)

Detección automatizada de defectos para componentes electrónicos producidos en masa basada en modelos de detección de objetos YOLO

NGGAN: GAN de generación de ruido basada en el conjunto de datos de medición práctica para comunicaciones por línea eléctrica de banda estrecha

PolySim: Superando la brecha entre simulación y realidad para el control de humanoides mediante la aleatorización dinámica de múltiples simuladores

Inercia de formato: un mecanismo de falla de los LLM en la preconsulta médica

Replanteando la regularización KL en RLHF: de la estimación de valores a la optimización de gradientes

Muestreo verbalizado: cómo mitigar el colapso modal y desbloquear la diversidad de LLM

MG2FlowNet: Aceleración de la generación de muestras de alta recompensa mediante MCTS mejorado y control de la codicia

LLM-MCoX: Exploración y búsqueda coordinada multirrobot basada en modelos de lenguaje grande

Auto-ARGUE: Evaluación de generación de informes basada en LLM

Muon supera a Adam en el aprendizaje de memoria asociativa de cola

Aprender a razonar como abstracciones de acción con RL escalable de mitad de entrenamiento

Agrupamiento consciente de la autonomía: cuando las decisiones locales prevalecen sobre las prescripciones globales

HNote: Ampliación de YNote con codificación hexadecimal para perfeccionar los LLM en modelado musical

Sobremuestreo generativo consciente de la incertidumbre mediante un autocodificador variacional condicional guiado por entropía

Autoridad artificial: De las mentes mecánicas a los alineamientos políticos. Un análisis experimental de los sesgos democráticos y autocráticos en modelos de lenguaje extenso.

InfMasking: Liberación de información sinérgica mediante interacciones multimodales contrastivas

Generación de conjuntos de datos de alta calidad para la edición de código mediante modelos de lenguaje de código abierto

Jina-reranker-v3: Interacción final para la reclasificación de documentos por lista

SafeFlowMatcher: Planificación segura y rápida mediante la coincidencia de flujos con funciones de barrera de control

Descubriendo las identificaciones de base: cómo las señales externas dan forma a la vinculación multimodal

FrameMind: razonamiento de vídeo intercalado con marcos mediante aprendizaje por refuerzo

Interpretación de la estimación de masa estelar basada en aprendizaje profundo mediante análisis causal y descomposición de información mutua

HFuzzer: Prueba de modelos de lenguaje grandes para alucinaciones de paquetes mediante fuzzing basado en frases

Límite sobre la mesa: Ataques eficientes basados en decisiones de caja negra para datos estructurados

Guía gratuita de clasificadores con reconocimiento de avisos para modelos de difusión

Ataques activos: Formación de equipos rojos de LLM mediante entornos adaptativos

¿Las subredes dispersas exhiben atención cognitivamente alineada? Efectos de la poda en la fidelidad, la dispersión y la coherencia conceptual de los mapas de saliencia.

Cuando el juicio se vuelve ruido: cómo los fallos de diseño en los criterios de evaluación de los jueces de LLM minan silenciosamente la validez

Almacenamiento en caché y descarga de modelos de IA de grano fino con difusión multipunto coordinada en redes de borde multicelda

Generación reforzada de estructuras combinatorias: aplicaciones a la teoría de la complejidad

La hipótesis de Narciso: descendiendo al peldaño de la ilusión

Repensando el papel de la complejidad del texto en el preentrenamiento de modelos lingüísticos

¿Los modelos de visión-lenguaje perciben las escenas urbanas como las personas? Un punto de referencia de la percepción urbana

FedMentor: Privacidad diferencial con reconocimiento de dominio para LLM federados heterogéneos en salud mental

MIA-EPT: Ataque de inferencia de membresía mediante predicción de errores para datos tabulares

Informe técnico de Fun-ASR

Generación de personajes alineados con la población para simulación social basada en LLM

TalkPlayData 2: Un canal de datos sintéticos agente para la recomendación de música conversacional multimodal

Hacking de modelos de lenguaje de gran tamaño: cuantificación de los riesgos ocultos del uso de LLM para la anotación de texto

X-Teaming Evolutionary M2S: Descubrimiento automatizado de plantillas de jailbreak de múltiples turnos a turnos únicos

Time2time: Intervención causal en estados ocultos para simular eventos raros en modelos de series temporales

Una política de difusión basada en el conocimiento para la conducción autónoma de extremo a extremo basada en rutas expertas

Modelos lingüísticos grandes posteriores al entrenamiento para obtener respuestas diversas y de alta calidad

La atención como filtro adaptativo

INGRID: Diseño robótico generativo inteligente utilizando modelos de lenguaje de gran tamaño

Meta-preentrenamiento para el reconocimiento de entidades nombradas en varios idiomas con cero disparos en lenguas filipinas con recursos limitados

Mezcla de contextos para la generación de vídeos largos

Recopilación flexible de metadatos para ecología mediante modelos lingüísticos de gran tamaño

Manipulación emocional por parte de compañeros de IA

SSFO: Optimización de fidelidad autosupervisada para la generación aumentada por recuperación

Shanshui Negativo: Síntesis de pintura con tinta interactiva en tiempo real

Sobre el aprendizaje por refuerzo de disparo cero

OpenWHO: Un corpus paralelo a nivel de documento para la traducción de información sanitaria en idiomas con recursos limitados

SurGE: Un marco de referencia y evaluación para la generación de encuestas científicas

Sinergia de profundidad y amplitud en RLVR: Desbloqueo de las ganancias de razonamiento de LLM con exploración adaptativa

Más vale prevenir que curar: Autoperfeccionamiento proactivo de modelos lingüísticos

TSLA: Una adaptación del aprendizaje específico de tareas para la segmentación semántica en la plataforma de vehículos autónomos

Street Review: Un marco participativo basado en IA para evaluar la inclusión del paisaje urbano

Poda sináptica: una inspiración biológica para la regularización del aprendizaje profundo

El tiempo es una característica: Explotación de la dinámica temporal en modelos de lenguaje de difusión

LPI-RIT en LeWiDi-2025: Mejora de las predicciones distribucionales mediante metadatos y reponderación de pérdidas con DisCo

SonicMaster: Hacia una restauración y masterización musical controlable todo en uno

C3: Un punto de referencia bilingüe para modelos de diálogo hablado que exploran los desafíos en conversaciones complejas

Las primeras señales de alucinación son diferentes a las condicionales

Evaluación de energía solar fotovoltaica con un modelo de lenguaje amplio

SIA: Mejora de la seguridad mediante la conciencia de la intención para los modelos de visión y lenguaje

Pureza del pensamiento: un marco de defensa para los ataques en cadena de pensamiento

MapIQ: Evaluación de modelos lingüísticos multimodales de gran tamaño para la respuesta a preguntas sobre mapas

TolerantECG: Un modelo fundamental para el electrocardiograma imperfecto

Validación de ítems psicométricos utilizando encuestados virtuales con mediadores de rasgo-respuesta

Modelos lingüísticos para profesionales de la salud: estructuración de transcripciones de voz en dos aplicaciones clínicas reales

¿Quién es el topo? Modelado y detección de agentes maliciosos con intenciones ocultas en sistemas multiagente basados en LLM

Optimas: Optimización de sistemas de IA compuestos con recompensas locales alineadas globalmente

Banco de autocorrección: Descubrimiento y abordaje del punto ciego de la autocorrección en modelos lingüísticos de gran tamaño

Uso de modelos cognitivos para revelar compensaciones de valores en modelos lingüísticos

Refactorización de bases de código mediante el diseño de bibliotecas

PhysioWave: un transformador wavelet multiescala para la representación de señales fisiológicas

Hacia la comprensión del sesgo en los datos sintéticos para la evaluación

Más allá de la fragmentación: recuperación jerárquica consciente del discurso para responder preguntas sobre documentos extensos

Micro-Act: Mitigación de conflictos de conocimiento en RAG basados en LLM mediante auto-razonamiento procesable

SSA-COMET: ¿Los LLM superan las métricas aprendidas en la evaluación de la traducción automática para lenguas africanas con recursos insuficientes?

MedAgentGym: Un entorno escalable de entrenamiento agéntico para el razonamiento centrado en código en la ciencia de datos biomédicos

SALAD: Evaluación sistemática del desaprendizaje automático en el diseño de hardware asistido por LLM

Aprendizaje en contexto para la exploración pura

FreqPolicy: Política visomotora autorregresiva de frecuencia con tokens continuos

RFCAudit: Un agente LLM para la detección de errores funcionales en protocolos de red

La amenaza a la seguridad de los proyectores comprimidos en modelos de lenguaje de visión de gran tamaño

Replanteando el desaprendizaje exacto bajo exposición: Extracción de datos olvidados bajo desaprendizaje exacto en un modelo de lenguaje amplio

La empatía humana como codificador: evaluación de la depresión asistida por IA en educación especial

CryoCCD: Difusión condicional consistente con el ciclo con modelado biofísico para la síntesis crio-EM

Análisis de estabilidad local y región de atracción para sistemas de retroalimentación de redes neuronales bajo restricciones de positividad

¿Qué se ha perdido con la evaluación sintética?

Banco de autocorrección: Descubrimiento y abordaje del punto ciego de la autocorrección en modelos lingüísticos de gran tamaño

Created by

Haebom

Autor

Ken Tsui

Autocorrección del punto ciego

Describir

Los modelos de lenguaje a gran escala (LLM) han revolucionado la IA, pero aún tienden a cometer errores y a explorar rutas de inferencia improductivas. Las capacidades de autocorrección son esenciales para implementar LLM en aplicaciones críticas para la seguridad. Este estudio reveló una falla sistemática de los LLM a la hora de corregir errores en su propia salida, un fenómeno conocido como "puntos ciegos de autocorrección", donde los LLM corrigen con éxito errores idénticos en fuentes externas, pero no los corrigen. Para investigar esto, presentamos el Banco de Autocorrección, un marco de evaluación que mide este fenómeno mediante la inyección controlada de errores en tres niveles de complejidad. Al probar 14 modelos de código abierto no inferenciales, observamos una tasa promedio de puntos ciegos del 64,5 %. Diversas evidencias sugieren que esta limitación puede estar influenciada por los datos de entrenamiento. En concreto, las demostraciones en humanos rara vez incluyen secuencias de corrección de errores, mientras que los modelos entrenados con aprendizaje de refuerzo (RL) aprenden a corregir errores mediante la retroalimentación de la salida. Cabe destacar que la adición de un aviso mínimo de "espera" redujo los puntos ciegos en un 89,3 %, lo que sugiere una posible capacidad que requiere activación. Este estudio destaca limitaciones importantes que pueden verse influenciadas por las distribuciones de entrenamiento y presenta enfoques prácticos para mejorar la confiabilidad de LLM.

Takeaways, Limitations

•

Takeaways:

◦

Descubrimiento de una limitación fundamental en la capacidad de autocorrección de los LLM: el "punto ciego de la autocorrección".

◦

Desarrollo de un marco de evaluación de Banco de Autocorrección.

◦

Esto sugiere que los datos de entrenamiento, especialmente los datos de demostración humana, pueden influir en este fenómeno.

◦

Descubrimos que manipulaciones simples como el mensaje "Espere" pueden reducir significativamente los puntos ciegos.

◦

Presenta un enfoque práctico para mejorar la confiabilidad de LLM en campos críticos para la seguridad.

•

Limitations:

◦

Puede estar limitado a modelos específicos y datos de entrenamiento (generalización limitada).

◦

No entiendo completamente el mecanismo detrás del efecto del mensaje "Esperar".

◦

Se centra exclusivamente en modelos no inferenciales. Se desconoce su aplicabilidad a modelos inferenciales.

Ver PDF

Made with Slashpage