Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

HoPE: Codificación posicional rotatoria hiperbólica para el modelado de dependencias estables de largo alcance en modelos de lenguaje extensos

Análisis comparativo de modelos de transformadores en la clasificación de tweets de desastres para la seguridad pública

Dinámicas sociales emergentes de los agentes LLM en el problema del bar El Farol

Lo bueno, lo malo y lo constructivo: medición automática de la utilidad de la revisión por pares para los autores

Los paisajes energéticos permiten una abstención fiable en modelos de lenguaje grande aumentados por recuperación para la atención médica

DEXOP: Un dispositivo para la transferencia robótica de la manipulación humana diestra

Aprendizaje por refuerzo para un control robusto del envejecimiento de sistemas de baterías de iones de litio con verificación formal basada en datos

RepoDebug: evaluación de depuración multitarea y multilenguaje a nivel de repositorio de modelos de lenguaje grandes

Modelado de cámara de eco de pozo de gravedad con un modelo de sesgo de confirmación basado en LLM

Perspectivas de la dinámica de gradientes: normalización de gradientes con escala automática

Virtuoso eficiente: un modelo de transformador de difusión latente para la planificación de trayectorias condicionadas por objetivos

MoSEs: Detección de texto generada por IA con conocimiento de la incertidumbre mediante la combinación de expertos en estilística con umbrales condicionales

DCPO: Optimización de la política de recorte dinámico

DSDE: Decodificación especulativa dinámica con estabilidad KLD para servicios en el mundo real

¿Puede la IA ser auditable?

Detección robótica de riesgos de incendio basada en razonamiento de grafos de conocimiento dinámicos: un enfoque basado en LLM con cadena de pensamiento de grafos

Navegando por la Ley de IA de la UE: Desafíos previsibles en la cualificación de las inspecciones automatizadas basadas en aprendizaje profundo de dispositivos médicos de clase III

Un sistema de aprendizaje complementario facilita el aprendizaje continuo en línea de la predicción del movimiento de vehículos en ciudades inteligentes.

MultiPL-MoE: Extensión multilingüe de programación de grandes modelos de lenguaje mediante una combinación híbrida de expertos

QuadKAN: Control de movimiento cuadrúpedo mejorado con KAN mediante aprendizaje de refuerzo de extremo a extremo

MovieCORE: Razonamiento cognitivo en el cine

Optimización automática de indicaciones con destilación rápida

Ataques de inferencia de membresía en sistemas de recomendación basados en LLM

Aprovechamiento de modelos lingüísticos de gran tamaño para una traducción precisa del lenguaje de señas en situaciones de bajos recursos

Optimización de la política de expectativas grupales para el aprendizaje de refuerzo heterogéneo

Convergencia y generalización de la antiregularización para modelos paramétricos

Jet-Nemotron: Modelo de lenguaje eficiente con búsqueda de arquitectura postneural

CARFT: Impulso del razonamiento LLM mediante aprendizaje contrastivo con ajuste fino reforzado basado en cadena de pensamiento anotada

Uniendo la generalización y la personalización en el reconocimiento de la actividad humana mediante el aprendizaje de pocos disparos en el dispositivo

FinAgentBench: Un conjunto de datos de referencia para la recuperación de agentes en la respuesta a preguntas financieras

Uso de la intuición artificial en una clasificación minimalista y diferenciada de resúmenes científicos para la gestión de carteras tecnológicas

Detector de discrepancias semánticas para la identificación de falsificaciones de imágenes

Soluciones de aprendizaje de refuerzo con eficiencia cuántica para la entrega a demanda en la última milla

BadPromptFL: Una nueva amenaza de puerta trasera para el aprendizaje federado basado en indicaciones en modelos multimodales

Confiabilidad basada en la incertidumbre: predicción selectiva e implementación confiable en el aprendizaje automático moderno

Análisis en tiempo real de datos no estructurados con aprendizaje automático en arquitecturas heterogéneas

VSI: Integración visual de subtítulos para la selección de fotogramas clave y una mejor comprensión de vídeos largos

SGDFuse: Difusión guiada por SAM para fusión de imágenes infrarrojas y visibles de alta fidelidad

Un MILP eficiente de tiempo continuo para la programación y el diseño integrados de hangares de aeronaves

DIRF: Un marco para la protección de la identidad digital y la gobernanza de clones en sistemas de IA de agentes

COLLAGE: Recuperación adaptativa basada en fusión para el aprendizaje aumentado de políticas

Razonamiento adaptativo dinámico a través de MCTS guiado por LLM para una KGQA eficiente y consciente del contexto

Refinamiento de pseudoetiquetas de gráficos anidados para el aprendizaje de adaptación del dominio de etiquetas ruidosas

LanternNet: un sistema de concentrador y radios para buscar y eliminar poblaciones de moscas linterna moteadas

RecPS: Puntuación de riesgo de privacidad para sistemas de recomendación

El ajuste fino supervisado de datos seleccionados es aprendizaje de refuerzo (y se puede mejorar)

Marco de apoyo multiagente basado en LLM y juego de roles para detectar y abordar el sesgo de comunicación familiar

PLAME: El diseño ligero de MSA mejora el plegamiento de proteínas a partir de incrustaciones evolutivas

Driver-Net: Fusión multicámara para evaluar la preparación del conductor para asumir el control en vehículos automatizados

Aprovechamiento de imágenes sin etiquetar fuera de distribución: segmentación semántica semisupervisada con un modelo de vocabulario abierto

Las estructuras visuales ayudan al razonamiento visual: abordar el problema de la vinculación en los VLM

Redes neuronales bayesianas precisas

Transporte para todos: mapeo de la conexión equitativa entre bicicletas y metro mediante el aprendizaje de representación regional

Escalamiento de la inteligencia: diseño de centros de datos para modelos de lenguaje de última generación

Segmentación de imágenes con modelos de lenguaje de gran tamaño: un estudio con perspectivas para sistemas de transporte inteligentes

SAIL: Ejecución más rápida que la demostración de políticas de aprendizaje por imitación

Simulación del comportamiento electoral en el Parlamento Europeo basada en personajes con modelos lingüísticos de gran tamaño

Control del equilibrio bípedo con simulaciones musculoesqueléticas de cuerpo entero de pie y caída

Informe técnico: Pronóstico y planificación de las leyes de escala del movimiento

Métodos eficientes de aprendizaje $Q$ y actor-crítico para un aprendizaje de refuerzo robusto con recompensa promedio

¿Quién recibe el crédito o la culpa? Atribución de responsabilidad en los sistemas de IA modernos

Emparejamiento de tipos celulares evolutivos no supervisados mediante transporte óptimo con entropía minimizada

Clasificación de múltiples salidas mediante una arquitectura de diafonía para el diagnóstico de fallas compuestas de motores en condición de etiquetado parcial

SoloSpeech: Mejora de la inteligencia y la calidad en la extracción del habla objetivo mediante un canal generativo en cascada

Orientación del razonamiento en LLM mediante la adaptación basada únicamente en sesgos

MetaSTH-Sleep: Hacia una clasificación eficaz de las etapas del sueño en pocas tomas para la gestión de la salud con metaaprendizaje mejorado con hipergrafos espacio-temporales

InterFeat: Un canal para encontrar características científicas interesantes

HumaniBench: Un marco centrado en el ser humano para la evaluación de grandes modelos multimodales

Avances en la clasificación de textos científicos: modelos optimizados con expansión de conjuntos de datos y votación directa

Pruébelo antes de confiar: Aplicación de pruebas de software para un aprendizaje en contexto confiable

Coincidencia de flujos de acción para el aprendizaje continuo del robot

Abordar el etiquetado incorrecto de conceptos en los modelos de cuello de botella conceptual mediante la optimización de preferencias

Nemotron-H: Una familia de modelos híbridos Mamba-Transformer precisos y eficientes

Aprendizaje federado robusto bizantino mediante redes generativas antagónicas

Más allá de SHAP y Anchors: un experimento a gran escala sobre cómo los desarrolladores luchan por diseñar explicaciones significativas para el usuario final

VIPER: Percepción visual y razonamiento explicable para la toma de decisiones secuencial

DistJoin: un estimador de cardinalidad de unión desacoplada basado en modulación de predicados neuronales adaptativos

Oro de baja confianza: refinamiento de muestras de baja confianza para un ajuste eficiente de las instrucciones

¿Asistencia o disrupción? Exploración y evaluación del diseño y las ventajas y desventajas del soporte proactivo para la programación de IA.

Los ataques de tokens blandos no pueden auditar de forma fiable el desaprendizaje en modelos de lenguaje grandes

CHIRLA: Identificación y reidentificación integral de alta resolución para análisis a gran escala

Redes de Fourier de Kolmogorov-Arnold

Posición: Los LLM pueden ser buenos tutores en la educación en inglés

Predicción del comportamiento en estado estacionario en redes complejas con redes neuronales gráficas

Separar el movimiento de la apariencia: personalizar el movimiento mediante la personalización de modelos de difusión de texto a vídeo

Segmentación de la anatomía cardíaca mejorada por el movimiento mediante un módulo de atención temporal insertable

Sesgo en la toma de decisiones para los dilemas éticos de la IA: un estudio comparativo de ChatGPT y Claude

OmniThink: Ampliando los límites del conocimiento en la escritura automática a través del pensamiento

DispFormer: un transformador preentrenado que incorpora restricciones físicas para la inversión de la curva de dispersión

Integración de evidencia en el diseño de sistemas de apoyo a la toma de decisiones basados en XAI e IA: un marco de medios y fines para usuarios finales en la construcción

Revelando el impacto de las muestras nativas sintéticas y las estrategias multitarea en la detección del humor y el sarcasmo en código hindi-inglés

Ecuaciones algebraicas diferenciales hamiltonianas de puerto neuronal para el aprendizaje compositivo de redes eléctricas

Difusiones de Langevin controladas secuencialmente

Aprendizaje federado que preserva la privacidad mediante redes antagónicas homomórficas

CAREL: Aprendizaje de refuerzo guiado por instrucción con objetivos auxiliares intermodales

Lecciones del estudio del razonamiento latente de dos saltos

HierTOD: Un sistema de diálogo orientado a tareas e impulsado por objetivos jerárquicos

Computación convolucional distribuida y codificada flexible para mejorar la resiliencia de rezagados y la estabilidad numérica en CNN distribuidas

FACEGroup: Explicaciones contrafácticas viables y viables para la equidad grupal

ETF: Un marco de rastreo de entidades para la detección de alucinaciones en el código Resumen

Informe técnico: Pronóstico y planificación de las leyes de escala del movimiento

Created by

Haebom

Autor

Mustafa Baniodeh, Kratarth Goel, Scott Ettinger, Carlos Fuertes, Ari Seff, Tim Shen, Cole Gulino, Chenjie Yang, Ghassen Jerfel, Dokook Choe, Rui Wang, Benjamin Charrow, Vinutha Kallem, Sergio Casas, Rami Al-Rfou, Benjamin Sapp, Dragomir Anguelov

Describir

Estudiamos las leyes de escalamiento empírico de la familia de modelos Transformer autorregresivos de codificador-decodificador para tareas de predicción y planificación del movimiento articular en conducción autónoma. Utilizando un conjunto de datos de conducción de 500.000 horas, demostramos que el rendimiento del modelo mejora como una función de ley de potencia del presupuesto computacional total, de forma similar al modelado de lenguajes, y que existe una fuerte correlación entre la pérdida de entrenamiento del modelo y las métricas de evaluación del mismo. Curiosamente, las métricas de bucle cerrado también mejoran con el escalamiento, lo que tiene importantes implicaciones para la idoneidad de las métricas de bucle abierto para el desarrollo de modelos y los enfoques ascendentes. También estudiamos el escalamiento óptimo del número de parámetros de Transformer y el tamaño de los datos de entrenamiento para modelos optimizados para el cómputo de entrenamiento. Descubrimos que un escalamiento óptimo requiere aumentar el tamaño del modelo 1,5 veces más rápido que el tamaño del conjunto de datos a medida que aumenta el presupuesto computacional de entrenamiento. También estudiamos el escalamiento del cómputo del tiempo de inferencia, demostrando que el muestreo y la agrupación de las salidas de modelos más pequeños los hacen competitivos con los modelos más grandes, y que, más allá de un punto de cruce, los modelos más grandes alcanzan una mayor eficiencia de cómputo de inferencia. En general, los resultados experimentales demuestran que optimizar las características de escalado temporal de entrenamiento e inferencia de los modelos de predicción y planificación de movimiento es clave para mejorar el rendimiento en diversos escenarios de conducción. Finalmente, exploramos brevemente la utilidad de utilizar datos de conducción registrados por otros agentes para mejorar el rendimiento de los agentes propios, un área crucial de investigación que aborda la escasez de datos robóticos para el entrenamiento de modelos a gran escala.

Takeaways, Limitations

•

Takeaways:

◦

Demostramos empíricamente que el rendimiento del modelo mejora como una función de ley de potencia del presupuesto computacional total.

◦

Se encontró una fuerte correlación entre la pérdida de entrenamiento del modelo y las métricas de evaluación del modelo.

◦

También confirmamos que el indicador de circuito cerrado mejora con la escala, lo que sugiere las limitaciones del indicador de circuito abierto.

◦

Presentamos estrategias de escalamiento óptimas para el tamaño del modelo y el tamaño del conjunto de datos para optimizar el cálculo del entrenamiento.

◦

Sugerir la posibilidad de mejorar la eficiencia del cálculo del tiempo de inferencia a través del muestreo de salida y la agrupación de modelos pequeños.

◦

Sugerir la posibilidad de mejorar el rendimiento de los autoagentes utilizando datos de otros agentes.

•

Limitations:

◦

El tema de investigación se limita a una serie específica de modelos de transformadores.

◦

Utilizando un conjunto de datos de conducción de 500.000 horas, se necesita más investigación para determinar la generalización de los datos.

◦

Se necesita más análisis y explicación sobre la mejora del indicador de circuito cerrado.

◦

Se necesita una mayor validación del rendimiento de la generalización en diversos escenarios de conducción.

◦

Se necesita una investigación más profunda sobre cómo otros agentes aprovechan los datos.

Ver PDF

Made with Slashpage