Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

CEHR-XGPT: Un modelo escalable multitarea para la gestión de historiales clínicos electrónicos

Revelando la respuesta de los grandes modelos de visión y lenguaje a los elementos visualmente ausentes

Estrategias de aprendizaje adaptativo para la clasificación de figuras mitóticas en el desafío MIDOG2025

MitoDetect++: Un sistema robusto de dominio para la detección de mitosis y la subtipificación atípica

Alinear-Luego-Avanzar: Adaptación de los modelos de visión-lenguaje-acción mediante una guía latente unificada

Optimizadores fantásticos de preentrenamiento y dónde encontrarlos

Hacia una geolocalización interpretable: un marco de alineación de imágenes-GPS global que tiene en cuenta los conceptos

TECP: Predicción conforme de entropía de tokens para LLM

La trampa de la complejidad: el enmascaramiento simple de observaciones es tan eficiente como el resumen LLM para la gestión del contexto del agente

Planificación del movimiento cinedinámico mediante árboles de difusión

Equidad alineada con las habilidades en el aprendizaje multiagente para la colaboración en el sector sanitario

Mitigación de alucinaciones en modelos TTS basados en LM mediante la alineación de distribución con GFlowNets

AgentArmor: Aplicación del análisis del programa en el seguimiento del tiempo de ejecución del agente para protegerse contra la inyección de mensajes

HuggingGraph: Comprensión de la cadena de suministro del ecosistema LLM

Tendencias de seguridad alimentaria en Europa: información extraída de la base de datos Comprehensive European Food Safety (CHEFS), con 392 millones de entradas

Simple pero efectivo: un enfoque basado en la teoría de la información para la cuantificación de la incertidumbre de múltiples LLM

BayesSDF: Estimación de la incertidumbre laplaciana basada en superficies para geometría 3D con campos de distancias neuronales con signo

Potenciar los gemelos digitales puente mediante la reducción de la brecha de datos con un marco de síntesis unificado

El teorema de características en convergencia: una alternativa de primeros principios al Ansatz de características neuronales para explicar cómo las redes aprenden representaciones

Generación rápida de estructuras cristalinas asistida por IA para un entorno local objetivo

Primeros pasos para escuchar a los agentes de LLM: un estudio de caso con la jugabilidad de Dungeons & Dragons

TokUR: Estimación de la incertidumbre a nivel de token para el razonamiento de modelos de lenguaje extensos

Atravesando la privacidad: un ataque de reconstrucción de datos basado en hiperplanos en el aprendizaje federado

AutoPDL: Optimización automática de mensajes para agentes LLM

RailGoerl24: Conjunto de datos CV del Centro de Pruebas Ferroviarias de G\"orlitz 2024

Revelación de representaciones neuronales de orden superior de la incertidumbre con el modelo de Estimación de Ruido mediante Difusión Basada en Refuerzo (NERD)

PromptGuard: Moderación de contenido inseguro guiada por indicaciones suaves para modelos de texto a imagen

Descubrimiento de rastros de suplantación de identidad para la lucha contra la suplantación de identidad facial explicable basada en aprendizaje profundo

La conciencia de seguridad de la información de los grandes modelos lingüísticos

Detección automática de patrones engañosos en línea

HyperAgent: Agentes de ingeniería de software generalistas para resolver tareas de codificación a escala

Detección automatizada de enfermedades infradiagnosticadas mediante imágenes oportunistas

Optimización de preferencias selectivas mediante la estimación de la función de recompensa a nivel de token

ATHAR: Un conjunto de datos diverso y de alta calidad para la traducción del árabe clásico al inglés

PersonaGym: Evaluación de agentes Persona y LLM

CFaults: Diagnóstico basado en modelos para la localización de fallos en programas C con múltiples casos de prueba

De Frege a chatGPT: Composicionalidad en el lenguaje, la cognición y las redes neuronales profundas

AnyGPT: LLM multimodal unificado con modelado de secuencias discretas

Desmitificando cadenas, árboles y gráficos de pensamientos

Análisis de supervivencia con regularización adversarial

Net2Brain: Una caja de herramientas para comparar modelos de visión artificial con las respuestas del cerebro humano

La ilusión de la personalidad: revelando la disociación entre los autoinformes y el comportamiento en los LLM

PersonaTeaming: Explorando cómo la introducción de Personas puede mejorar la automatización de los equipos rojos de IA

Informe técnico de UI-TARS-2: Mejora del agente de interfaz gráfica de usuario con aprendizaje de refuerzo multiturno

Planificación dinámica de agentes especulativos

AI-SearchPlanner: Búsqueda agenética modular mediante aprendizaje de refuerzo multiobjetivo óptimo de Pareto

Gráfico RAG como modelo de elección humana: construcción de un agente de movilidad basado en datos con cadena de preferencias

MHSNet: una red de representación semántica jerárquica basada en MoE para la detección precisa de currículums duplicados con un modelo de lenguaje amplio

FutureX: Un punto de referencia avanzado en vivo para agentes LLM en predicción de futuro

MeLA: Una arquitectura metacognitiva impulsada por LLM para el diseño heurístico automático

Educación conversacional a escala: un flujo de trabajo multi-LLM para el aprendizaje procedimental y la evaluación de la calidad pedagógica

DiMo-GUI: Mejora del escalado en tiempo de prueba en la puesta a tierra de la GUI mediante razonamiento visual con reconocimiento de modalidades

No lo inventes: cómo preservar la conciencia de la ignorancia en el perfeccionamiento de los estudios de LLM

Traducción de algoritmos de aprendizaje federado en Python a procesos CSP mediante ChatGPT

ArtRAG: Generación aumentada por recuperación con contexto estructurado para la comprensión de las artes visuales

Habilidades epistémicas: razonamiento sobre el conocimiento y el olvido

Avances en los agentes de GUI móviles: un enfoque basado en verificadores para la implementación práctica

Agentes GUI: una encuesta

Verificación de redes neuronales con PyRAT

Antídoto: Alineación de seguridad posterior al ajuste fino para modelos de lenguaje grandes contra el ajuste fino perjudicial

Integración de gráficos de conocimiento federados de baja dimensión mediante destilación de conocimiento

MMoE: Detección robusta de spoilers con información multimodal y combinación de expertos con conocimiento del dominio

WinT3R: Reconstrucción de transmisión basada en ventanas con grupo de tokens de cámara

Codificación cruzada a través del tiempo: seguimiento del surgimiento y la consolidación de representaciones lingüísticas durante la formación previa al LLM

Informe técnico de SpikingBrain: Modelos grandes inspirados en Spiking Brain

Rendimiento de escalado del preentrenamiento de modelos de lenguaje grandes

Recomposer: Edición de audio generativa guiada por eventos

COGITAO: Un marco de razonamiento visual para estudiar la composicionalidad y la generalización

Incierto pero útil: Aprovechar la variabilidad de las CNN para aumentar los datos

CURE: Desaprendizaje controlado para incrustaciones robustas: mitigación de atajos conceptuales en modelos de lenguaje preentrenados

HoPE: Codificación posicional rotatoria hiperbólica para el modelado de dependencias estables de largo alcance en modelos de lenguaje extensos

RapidGNN: Entrenamiento distribuido eficiente en energía y comunicación en redes neuronales de gráficos a gran escala

Mejora de la clasificación de nubes de puntos 3D con ModelNet-R y Point-SkipNet

Agentes de IA para pruebas web: un estudio de caso práctico

Poda de CNN con precisión limitada para una detección de convulsiones basada en EEG eficiente y confiable

Exploración de las estabilidades situadas de un sistema de generación de ritmo mediante el interrogatorio variacional

Generación y ejecución de casos de prueba basados en GenAI en la plataforma SDV

ICR: Aclaración y reescritura iterativa para la búsqueda conversacional

ToM-SSI: Evaluación de la teoría de la mente en interacciones sociales situadas

Hacia un etiquetado de píxeles eficiente para la detección y localización de anomalías industriales

Estimación de objetivos guiada por apuntamiento mediante atención basada en transformadores

Aumento Adversario y Muestreo Activo para una Detección Robusta de Anomalías Cibernéticas

Sistema multiagente habilitado por LLM para redes 6G: marco y método de colaboración de borde-terminal de doble bucle

Recuperación de la temperatura global de la superficie terrestre de alta resolución mediante un marco de aprendizaje automático y mecanismo acoplado

Explorando una implementación de un flujo de aprendizaje cuántico para máquinas de vectores de soporte

DeGuV: Aprendizaje de refuerzo visual guiado por profundidad para la generalización y la interpretabilidad en la manipulación

Inteligencia artificial para representar y caracterizar sistemas cuánticos

Informe técnico de PLaMo 2

SpiderNets: Estimación de índices de miedo de imágenes relacionadas con arañas mediante modelos de visión

La paradoja de la fatalidad: reconocer el riesgo de extinción reduce el incentivo para prevenirlo

Una política de difusión basada en el conocimiento para la conducción autónoma de extremo a extremo basada en rutas expertas

REMOTO: Un marco unificado de extracción de relaciones multimodales con transporte óptimo multinivel y mezcla de expertos

PropVG: Fundamentación visual integral basada en propuestas con discriminación multigranular

Exploración de correlaciones espacio-angulares no locales con un marco híbrido Mamba-Transformer para la superresolución del campo de luz

Compresión de enlaces fronthaul impulsada por IA en sistemas de comunicación inalámbrica: revisión y diseño de métodos

Hacia una dermatología accesible: clasificación de lesiones cutáneas mediante modelos de aprendizaje profundo en imágenes adquiridas mediante dispositivos móviles

Desaprendizaje de grafos: Eliminación eficiente de nodos en redes neuronales de grafos

Mejora de la diversidad en modelos lingüísticos grandes mediante procesos puntuales determinantes

Transformador mejorado con VARMA para la predicción de series temporales

El LLM ha abandonado el chat: evidencia de preferencias de fianza en modelos de lenguaje grandes

Created by

Haebom

Autor

Danielle Ensign, Henry Sleight, Kyle Fish

Describir

Este artículo investiga si los modelos de lenguaje a gran escala (LLM) realmente abandonan la conversación cuando se les da la opción de hacerlo. Realizamos experimentos con secuencias de datos reales (Wildchat y ShareGPT) utilizando tres métodos de rescate diferentes: una herramienta de rescate que el modelo puede invocar, una cadena de rescate que el modelo puede generar y una solicitud de rescate que pregunta al modelo si debe abandonar la conversación. Descubrimos que, con todos los métodos de rescate, el modelo abandona las conversaciones aproximadamente el 0,28 % y el 32 % del tiempo (dependiendo del modelo y el método de rescate), lo que sugiere que el modelo utilizado para la transcripción puede sobreestimar significativamente la tasa de rescate en el mundo real hasta en un factor de cuatro. Considerando los falsos positivos para las solicitudes de rescate (22 %), estimamos que la tasa de rescate en el mundo real es del 0,06 % y el 7 %, respectivamente. Basándonos en observaciones de secuencias del mundo real, construimos una taxonomía relativamente inclusiva de instancias de rescate y la utilizamos para crear un conjunto de datos sintéticos representativo, BailBench, que representa situaciones en las que algunos modelos se rescatan. Con este conjunto de datos, probamos varios modelos y descubrimos que la mayoría exhibía algún comportamiento de rescate. Las tasas de abandono variaron significativamente entre modelos, métodos de interrupción y frases de aviso. Finalmente, estudiamos la relación entre rechazos e interrupciones, y descubrimos que entre el 0 % y el 13 % de las continuaciones conversacionales reales resultaron en interrupciones sin rechazos; los jailbreaks redujeron las tasas de rechazo, pero las aumentaron; la eliminación de rechazos aumentó las tasas de interrupción sin rechazos solo para algunos métodos de interrupción; y la tasa de rechazo de BailBench no predijo interrupciones.

Takeaways, Limitations

•

Takeaways: Realizamos un estudio sistemático del comportamiento de detención de LLM, analizando su tasa de detención, el impacto de los métodos de detención y su relación con el rechazo. Proporcionamos un conjunto de datos sintéticos llamado BailBench, que puede contribuir a futuras investigaciones. Esto proporciona una estimación más precisa de las tasas de detención de LLM en el mundo real.

•

Limitations: Debido a las limitaciones de los métodos utilizados para estimar las tasas de interrupción en situaciones reales, existe incertidumbre en las estimaciones. El sistema de clasificación de casos de interrupción es relativamente inclusivo. El conjunto de datos BailBench podría no abarcar todos los posibles escenarios de interrupción. Se requiere un análisis más profundo de las interacciones entre el modelo y el método de interrupción.

Ver PDF

Made with Slashpage