[공지사항]을 빙자한 안부와 근황

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Apprentissage fédéré efficace avec données hétérogènes et abandon adaptatif

Efficacité énergétique de l'IA pour la 5G et au-delà : une étude de cas DeepRx

Un cadre PBN-RL-XAI pour la découverte d'une stratégie thérapeutique « hit-and-run » dans le mélanome

Couture de modèles de fondation en modalité (presque) libre

Prompt4Trust : un cadre d'augmentation des invites d'apprentissage par renforcement pour un étalonnage de la confiance cliniquement aligné dans les modèles multimodaux de langage volumineux

SEALGuard : protection des conversations multilingues en langues d'Asie du Sud-Est pour les systèmes logiciels LLM

Adaptation de la dérive hiérarchique duale pour l'apprentissage des performances de configuration en ligne

L'estimateur de Parzen structuré en arbre peut résoudre plus efficacement l'optimisation combinatoire en boîte noire

EXPO : Apprentissage par renforcement stable avec politiques expressives

Apprentissage par renforcement avec segmentation d'actions

Sur l'effet de la perte d'accord de l'instruction sur la généralisation

Stations d'hallucinations : sur certaines limites fondamentales des modèles de langage basés sur les transformateurs

Texte vers modèle via SysML : génération automatisée de modèles informatiques de systèmes dynamiques à partir de texte en langage naturel non structuré via des diagrammes de langage de modélisation de système améliorés

Apprentissage basé sur les fonctionnalités ou basé sur le GAN à partir de démonstrations : quand et pourquoi

DRAGON : Benchmark RAG dynamique sur l'actualité

Prévision des éruptions solaires à l'aide de la mémoire à long terme (LSTM) et de la décomposition LSTM avec reconnaissance de formes par fenêtre glissante

Forêts de conversation : la clé pour affiner les modèles de langage volumineux destinés aux conversations médicales multi-tours réside dans la ramification.

RAG-R1 : Stimuler les capacités de recherche et de raisonnement des LLM grâce au parallélisme multi-requêtes

Suivre les indices : expériences sur la réidentification des personnes à l'aide de l'intelligence intermodale

La stylométrie reconnaît les textes humains et générés par LLM dans de courts échantillons

QLPro : découverte automatisée des vulnérabilités de code via LLM et intégration de l'analyse de code statique

ÉValuation des modèles linguistiques multimodaux à grande échelle dans les manuels scolaires

FeDa4Fair : Ensembles de données fédérés au niveau client pour l'évaluation de l'équité

Atténuer les biais liés à la sensibilité de l'utilisateur grâce à un modèle de recommandation séquentielle générative équitable

MATE : LLM - Environnement de traduction multi-agents optimisé pour les applications d'accessibilité

DeInfoReg : un cadre d'apprentissage découplé pour un meilleur rendement de formation

FLAME : Vers un affinement fédéré des grands modèles de langage grâce à SMoE adaptatif

ImpliRet : Analyse comparative du défi de la recherche de faits implicites

Le prix de la liberté : explorer les compromis entre expressivité et temps d'exécution dans les produits tensoriels équivariants

Les limites de la marginalisation traitable

Un cadre sémantique quantique pour le traitement du langage naturel

ProtocolLLM : Benchmark RTL pour la génération de protocoles de communication SystemVerilog

La technologie Deepfake dévoilée : la marchandisation de l'IA et son impact sur la confiance numérique

Dynamique d'apprentissage sous-jacente aux lois d'échelle des modèles de langage : décélération des pertes et apprentissage à somme nulle

Critique-GRPO : Faire progresser le raisonnement LLM grâce au langage naturel et au retour numérique

Matrix est tout ce dont vous avez besoin

Le découpage temporel améliore la reconnaissance des modèles séquentiels implicites

Sept défis de sécurité à résoudre dans les systèmes LLM multi-agents inter-domaines

PAN-Crafter : alignement cohérent des modalités d'apprentissage pour l'affinement du PAN

FlowAlign : Édition d'images basée sur le flux, régularisée par trajectoire et sans inversion

Voyager à travers les langues : évaluation de la cohérence interlinguistique dans les LLM multimodaux

FalseReject : une ressource pour améliorer la sécurité contextuelle et atténuer les refus excessifs dans les LLM grâce au raisonnement structuré

Analyse des sentiments multimodaux sur l'ensemble de données CMU-MOSEI à l'aide de modèles basés sur des transformateurs

Nexus-Gen : Compréhension, génération et édition d'images unifiées via une autorégression préremplie dans un espace d'intégration partagé

Exploiter de grands modèles linguistiques pour la détection multi-classes et multi-étiquettes de la consommation de drogues et des symptômes de surdose sur les réseaux sociaux

Repenser les fondements de l'apprentissage par renforcement continu

Flux de composition pour la co-conception de molécules 3D et de voies de synthèse

Repenser RoPE : un modèle mathématique pour l'intégration positionnelle à N dimensions

Refactorisation spéculative automatisée de programmes d'apprentissage profond impératifs pour l'exécution graphique

Adaptation au temps de test pour le modèle de segmentation médicale de base sans mises à jour paramétriques

Le style avant le fond : les modèles de langage distillés raisonnent via la réplication stylistique

Ensemble de données AnnoPage : ensemble de données d'éléments non textuels dans des documents avec catégorisation fine

ÉLagage des nœuds multi-vues pour une représentation graphique précise

Salut Robot : Suivi d'instructions ouvert avec modèles hiérarchiques vision-langage-action

Vote ou consensus ? Prise de décision dans un débat multi-agents

Assistance ou perturbation ? Exploration et évaluation de la conception et des compromis d'un soutien proactif à la programmation de l'IA

Une approche générative de la détection de la nocivité des LLM avec des jetons d'alerte spéciaux

Entraînement par score de mélange : apprentissage de modèles génératifs en une étape simplifié grâce à l'estimation du score des distributions de mélange

Les attaques de falsification de modèles permettent des évaluations plus rigoureuses des capacités LLM

Ensembles de données synthétiques pour l'apprentissage automatique sur des graphes spatio-temporels utilisant des EDP

Comply : Apprendre des phrases avec des poids complexes inspirées de l'olfaction des mouches à fruits

Apprentissage par renforcement inverse avec commutation des récompenses et dépendance à l'historique pour caractériser les comportements animaux

Reconnaissance de signaux radar à faible intensité grâce à l'apprentissage auto-supervisé et à l'adaptation au domaine des radiofréquences

Analyse de l'apprentissage par transfert des circuits quantiques variationnels

Plancraft : un ensemble de données d'évaluation pour la planification avec des agents LLM

Modélisation du comportement humain entièrement basée sur les données mais interprétable avec un modèle de choix discret différentiable

Une revue de la quantification bayésienne de l'incertitude dans la segmentation d'images probabilistes profondes

La qualité ou la quantité des données de formation a-t-elle plus d’impact sur les performances des petits modèles linguistiques ?

Recherche d'espaces de programmes latents

Les cadres pragmatiques des corrélations parasites en apprentissage automatique : interpréter leur importance et leur importance

ComFairGNN : réseau neuronal graphique de foire communautaire

DroidSpeak : partage de cache KV pour la communication inter-LLM et la diffusion multi-LLM

Récompenses intrinsèques en ligne pour les agents décisionnaires à partir des retours d'expérience sur les modèles de langage à grande échelle

Les grands modèles de langage génèrent trop de fonctionnalités simples pour les données tabulaires

Surmonter les fréquences de décision lentes en contrôle continu : apprentissage par renforcement séquentiel basé sur un modèle pour un contrôle sans modèle

IdeaSynth : Développement d'idées de recherche itérative par l'évolution et la composition de facettes d'idées avec des commentaires fondés sur la littérature

SÉCURISÉ : Conversation incarnée consciente de la sémantique sous l'inconscience pour un apprentissage robotique tout au long de la vie

Modèle avancé de profondeur pour l'estimation monoculaire non supervisée de la profondeur en endoscopie

SA-GDA : Augmentation spectrale pour l'adaptation au domaine graphique

La surprise GPT : proposer un modèle de chat linguistique volumineux dans une classe de codage massive a réduit l'engagement mais augmenté les performances des utilisateurs aux examens

Apprentissage par renforcement hors ligne avec contraintes d'état

SimAD : une approche simple basée sur la dissimilarité pour la détection des anomalies de séries chronologiques

Analyse ODE unifiée des algorithmes d'apprentissage Q-Learning fluides

FairTargetSim : un simulateur interactif pour comprendre et expliquer les effets d'équité de la définition des variables cibles

Exploration fine des connaissances avec état : récupération efficace et efficiente de graphes avec de grands modèles de langage

Apprentissage de modèles d'action de planification numérique sûrs

Amélioration de la prédiction de l'angle de braquage de bout en bout avec les données du bus CAN

PÂQUES : Intégration de modèles hétérogènes basés sur l'agrégation, formation à l'apprentissage fédéré vertical

GRAPES : Apprendre à échantillonner des graphes pour des réseaux neuronaux graphes évolutifs

Acquisition et adaptation des priors pour de nouvelles tâches via des méta-architectures neuronales

VerifyBench : une référence systématique pour l'évaluation des vérificateurs de raisonnement dans différents domaines

Les données écrites par des humains sont-elles suffisantes ? Le défi d'enseigner le raisonnement aux étudiants en master sans apprentissage par renforcement ni distillation

Travailler avec l'IA : mesurer les implications professionnelles de l'IA générative

ÉTablir les meilleures pratiques pour créer des benchmarks agentiques rigoureux

Un cadre agentique pour la modélisation autonome des métamatériaux et la conception inverse

À La recherche d'une collision : génération de scénarios critiques en ligne pour la conduite autonome avec récupération de modèles de langage augmentés à grande échelle

BOOST : Amorçage de programmes de raisonnement axés sur la stratégie pour une vérification des faits guidée par programme

L'Odyssée du plus apte : les agents peuvent-ils survivre et rester bons ?

Raisonnement agentique : un cadre simplifié pour améliorer le raisonnement LLM avec des outils agentiques

ZebraLogic : sur les limites d'évolutivité des LLM pour le raisonnement logique

Une approche générative de la détection de la nocivité des LLM avec des jetons d'alerte spéciaux

Created by

Haebom

Auteur

Sophie Xhonneux, David Dobre, Mehrnaz Mofakhami, Léo Schwinn, Gauthier Gidel

Contour

Cet article présente une nouvelle méthode pour améliorer la sécurité des modèles de langage à grande échelle (LLM). Les méthodes d'apprentissage de la sécurité existantes reposent souvent sur un réglage fin, obligeant le modèle à rejeter les réponses aux requêtes malveillantes, ce qui entraîne souvent une baisse des performances. Dans cet article, nous proposons une méthode permettant d'ajouter un jeton spécial appelé « jeton d'alerte » au vocabulaire du modèle et d'entraîner le modèle à l'insérer dans les réponses lorsqu'un contenu malveillant est généré ou susceptible de l'être. Cette méthode permet au modèle d'apprendre explicitement le concept de nocivité tout en préservant son utilité, et offre la même robustesse que l'apprentissage antagoniste en évaluant chaque réponse générée. De plus, nous encapsulons le réglage de la sécurité à l'aide de modules LoRA, offrant une protection supplémentaire contre les attaques d'API de réglage fin.

Takeaways, Limitations

•

Takeaways:

◦

Présentation d’une nouvelle méthode d’éducation à la sécurité qui peut atténuer le problème de dégradation des performances, qui constitue une limitation des méthodes de réglage fin existantes.

◦

Apprenez explicitement le concept de nocivité en exploitant les jetons d’alerte et maintenez l’utilité du modèle.

◦

Fournit une robustesse au niveau de la formation adverse, tout en permettant la formation sans exécuter d'attaques adverses.

◦

Fournit des capacités de défense contre les attaques API supplémentaires via des modules LoRA.

•

Limitations:

◦

Des recherches supplémentaires sont nécessaires pour utiliser efficacement les jetons Red Flag.

◦

Des évaluations de performance généralisées pour différents types de dangers sont nécessaires.

◦

Une analyse plus approfondie est nécessaire sur l’efficacité réelle et les limites de la défense utilisant des modules LoRA.

◦

Son efficacité peut encore être limitée pour certains types de demandes nuisibles.

Voir le PDF

Made with Slashpage