Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Las emociones como representaciones ordinales conscientes de la ambigüedad

De la Tabula Rasa a las Habilidades Emergentes: Descubrimiento de las Habilidades de los Robots a través de la Diversidad de Calidad No Supervisada en el Mundo Real

Mejora de la privacidad del modelo en el aprendizaje federado con enmascaramiento aleatorio y cuantificación

Leyes de escalamiento para el conocimiento estratificado por tareas en modelos de lenguaje cuantizados de gran tamaño posteriores al entrenamiento

Detección basada en principios de alucinaciones en grandes modelos lingüísticos mediante pruebas múltiples

Discriminador de características proyectadas por vocoder

ControlEchoSynth: Mejora de los modelos de estimación de la fracción de eyección mediante difusión de vídeo controlada

Explique antes de responder: una encuesta sobre razonamiento visual compositivo

Red de difusión de un solo paso con conciencia del tiempo para una súper resolución de imágenes del mundo real

PediatricsMQA: un modelo de referencia multimodal de preguntas y respuestas en pediatría

VideoEraser: Borrado de conceptos en modelos de difusión de texto a vídeo

Un estudio sistemático de los ataques y defensas de extracción de modelos: estado del arte y perspectivas

GeoSAM2: Liberando el poder de SAM2 para la segmentación de piezas 3D

Escala de tiempo de entrada

LinguaSafe: un referente integral de seguridad multilingüe para modelos lingüísticos de gran tamaño

Una encuesta sobre la generación de texto paralelo: de la decodificación paralela a los modelos de lenguaje de difusión

StreetViewAI: Haciendo que Street View sea accesible mediante IA multimodal sensible al contexto

Putnam-AXIOM: Un punto de referencia funcional y estático para medir el razonamiento matemático de nivel superior en los LLM

De la imitación a la optimización: un estudio comparativo del aprendizaje offline para la conducción autónoma

R-Zero: LLM en Razonamiento Autoevolutivo desde Datos Cero

Interacción humano-IA centrada en el ser humano (HC-HAII): una perspectiva de IA centrada en el ser humano

GTPO: Optimización de políticas basada en trayectorias en modelos de lenguaje grandes

Aprendizaje multitarea contrastivo con aumento basado en solventes para el descubrimiento de fármacos

Un punto de referencia a gran escala del aprendizaje intermodal para la histología y la expresión génica en la transcriptómica espacial

Arquitecturas invisibles del pensamiento: hacia una nueva ciencia de la IA como infraestructura cognitiva

Revisión de modelos de lenguaje preentrenados para la detección de vulnerabilidades

Megaciencia: Ampliando las fronteras de los conjuntos de datos posteriores al entrenamiento para el razonamiento científico

Escalando el aprendizaje descentralizado con FLock

SegQuant: Un marco de cuantificación generalizable y consciente de la semántica para modelos de difusión

Modelos de lenguaje de la Fundación Apple Intelligence: Informe tecnológico 2025

Exploración optimista para el aprendizaje de refuerzo restringido con aversión al riesgo

PyVision: Visión agencial con herramientas dinámicas

DATABench: Evaluación de la auditoría de conjuntos de datos en aprendizaje profundo desde una perspectiva adversarial

RoboTwin 2.0: Un generador de datos escalable y un punto de referencia con una sólida aleatorización de dominios para una manipulación robótica bimanual robusta

Análisis de la representación de personajes en el contenido mediático mediante el modelo de base multimodal: eficacia y confianza

MEraser: Un método eficaz de borrado de huellas dactilares para modelos lingüísticos de gran tamaño

CoQuIR: Un punto de referencia integral para la recuperación de información con reconocimiento de la calidad del código

DreamActor-H1: Generación de videos de demostración de alta fidelidad entre personas y productos mediante transformadores de difusión diseñados para el movimiento.

Pseudosimulación para la conducción autónoma

BinConv: una arquitectura neuronal para la codificación ordinal en la predicción de series temporales

FaceEditTalker: Generación controlable de cabezas parlantes con edición de atributos faciales

EnvInjection: Ataque de inyección de mensajes ambientales a agentes web multimodales

X-Sim: Aprendizaje entre encarnaciones a través de Real-Sim-a-Real

Modelos de difusión de calor: mecanismo de atención entre píxeles

Planificación bidireccional de tareas y movimientos basada en el aprendizaje de refuerzo jerárquico para la confrontación estratégica

Sistemas de recomendación conversacional multitipo sensibles al contexto mediante una combinación de expertos

Precisión del modelo de IA de precios

Evaluación de la idoneidad de las ontologías para la tarea de generación de preguntas

Anotación LLM centrada en la utilidad para la recuperación y la generación aumentada por recuperación

PGAD: Destilación adaptativa guiada por prototipos para el aprendizaje multimodal en el diagnóstico de la EA

Construcción de una norma para el dibujo científico infantil: características de distribución basadas en la similitud semántica de grandes modelos lingüísticos

Un enfoque empírico de minimización de riesgos para el RL inverso fuera de línea y el modelo de elección discreta dinámica

PINN eficientes mediante regularización unimodular multicabezal del espacio de soluciones

El aprendizaje estadístico no siempre implica conocimiento

Modelos de difusión generativa basados en puntuaciones para recomendaciones sociales

PromptKeeper: Protección de las indicaciones del sistema para los LLM

X-Indicación: Hacia la generación universal de imágenes en contexto en modelos de la Fundación del Lenguaje de Visión Autorregresiva

Comprender las compensaciones entre equidad y precisión en los modelos de aprendizaje automático: ¿Promover la equidad perjudica el rendimiento?

GSM-Symbolic: Comprensión de las limitaciones del razonamiento matemático en modelos de lenguaje grandes

Aprovechamiento de rutas multifacéticas para el aprendizaje de la representación de gráficos heterogéneos

Entrenamiento solo con explicaciones: un nuevo paradigma para evitar el aprendizaje de atajos

Generación de geodésicas con aprendizaje de refuerzo actor-crítico para predecir puntos medios

TabSketchFM: Aprendizaje de representación tabular basado en bocetos para el descubrimiento de datos en lagos de datos

HoneyBee: Un marco modular escalable para la creación de conjuntos de datos oncológicos multimodales con modelos de integración fundamentales

StepWiser: Jueces generativos paso a paso para un razonamiento más sabio

AniME: Planificación adaptativa multiagente para la generación de animaciones largas

AppAgent-Pro: un sistema de agente GUI proactivo para la integración de información multidominio y la asistencia al usuario

Los acompañantes de IA son (realmente) todo lo que necesitas para evitar relaciones parasociales con chatbots

Nemori: Agente autoorganizador de la memoria inspirado en la ciencia cognitiva

Los agentes generales contienen modelos mundiales

Construcción aproximada del modelo levantado

Panorama de aptitud de la búsqueda automatizada de algoritmos asistida por modelos de lenguaje de gran tamaño

Sintetización de tareas de programación de alta calidad con agentes expertos y estudiantiles basados en LLM

Obtención de preferencias para optimización combinatoria multiobjetivo con aprendizaje activo y estimación de máxima verosimilitud

Recuperación alineada con la referencia y respuesta a preguntas aumentadas sobre documentos propietarios heterogéneos

Demostración de especificaciones en modelos de razonamiento de juegos

AirRAG: Planificación estratégica autónoma y razonamiento, recuperación de dirección, generación aumentada

¡Piensa con inteligencia, actúa con inteligencia! Análisis de escudos lógicos probabilísticos para el aprendizaje por refuerzo multiagente

De la evidencia a la decisión: explorando la IA evaluativa

CODA: Coordinación del cerebro y el cerebelo para un agente de uso informático de cerebro dual con aprendizaje de refuerzo desacoplado

Difusión guiada discreta para una planificación escalable y segura del movimiento de múltiples robots

Autocodificador enmascarado de progresión de parches con red CNN de fusión para clasificar la evolución entre dos pares de cortes OCT 2D

DeepScholar-Bench: Un punto de referencia en vivo y una evaluación automatizada para la síntesis de investigación generativa

Modelos de lenguaje grande (LLM) para la automatización del diseño electrónico (EDA)

Symphony: Un marco multiagente descentralizado para una inteligencia colectiva escalable

Gemelos digitales de HPC para evaluar políticas de programación, estructuras de incentivos y su impacto en la energía y la refrigeración

Descomposición de las transiciones de fase conductuales en los LLM: parámetros de orden para la desalineación emergente

Categorización y recategorización de productos de comercio electrónico multiplataforma: un enfoque de clasificación jerárquica multimodal

Selección de demostración en tiempo lineal para el aprendizaje en contexto mediante estimación de gradiente

MathBuddy: Un sistema multimodal para la tutoría afectiva de matemáticas

Modelos de lenguaje de difusión Conozca la respuesta antes de decodificar

GLSim: Detección de alucinaciones de objetos en LVLM mediante similitud global-local

Dhati+: Modelos lingüísticos amplios y perfeccionados para la evaluación de la subjetividad del árabe

WaveHiT-SR: Red jerárquica de wavelets para una superresolución de imágenes eficiente

La siguiente capa: ampliación de los modelos de base con preservación de la estructura y aprendizaje guiado por la atención para parches locales hasta la conciencia del contexto global en patología computacional

Razonamiento lógico con modelos de recompensa por resultados para escalar el tiempo de prueba

La dinámica de la información de la difusión generativa

Detección de lenguaje inapropiado en los programas de medicina mediante IA

IA generativa para probar sistemas de conducción autónoma: una encuesta

Datos LiDAR multiespectrales para la extracción de puntos de árboles en áreas urbanas y suburbanas

PromptKeeper: Protección de las indicaciones del sistema para los LLM

Created by

Haebom

Autor

Zhifeng Jiang, Zhihua Jin, Guoliang He

Describir

Este artículo propone un mecanismo de defensa llamado PromptKeeper para abordar las preocupaciones de seguridad relacionadas con los avisos del sistema que guían la salida de los modelos de lenguaje a gran escala (LLM). Los avisos del sistema suelen contener lógica de negocio e información confidencial, lo que los hace vulnerables a la explotación de vulnerabilidades de los LLM mediante consultas maliciosas o comunes de usuario. PromptKeeper aborda dos desafíos clave: detectar fugas de avisos de forma fiable y mitigar las vulnerabilidades de canal lateral cuando se producen. Al enmarcar la detección de fugas como un problema de prueba de hipótesis, identifica eficazmente tanto fugas explícitas como sutiles. Cuando se detecta una fuga, regenera las respuestas utilizando avisos ficticios, haciéndolas indistinguibles de las interacciones normales sin fugas. En consecuencia, proporciona una protección robusta contra ataques de extracción de avisos mediante consultas maliciosas o comunes, a la vez que mantiene las capacidades conversacionales y la eficiencia de ejecución de las interacciones de usuario típicas.

Takeaways, Limitations

•

Takeaways:

◦

Proporcionar soluciones efectivas a las amenazas de seguridad en los sistemas LLM.

◦

Proporciona una defensa sólida contra ataques maliciosos y consultas comunes de los usuarios.

◦

Presentamos un mecanismo eficiente para la detección y mitigación rápida de fugas.

◦

Mantener las habilidades de conversación y la eficiencia de ejecución.

•

Limitations:

◦

Es necesaria una evaluación más profunda del rendimiento y la estabilidad del mecanismo de defensa propuesto en entornos reales.

◦

Es necesaria la verificación de generalización para varios tipos de LLM y técnicas de ataque.

◦

Se necesita optimizar y mejorar la seguridad de la estrategia de generación de mensajes ficticios.

◦

Es necesario analizar la sobrecarga adicional y la degradación del rendimiento que puede ocurrir cuando se aplica a sistemas reales.

Ver PDF

Made with Slashpage