Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Les utilités individuelles de la satisfaction de vie révèlent une aversion aux inégalités sans rapport avec l'alignement politique

DischargeSim : une simulation de référence pour la communication éducative médecin-patient à la sortie de l'hôpital

Régularisation de la gaussianité basée sur le spectre de moment et de puissance pour les modèles texte-image

Concept computationnel de la psyché (en russe)

MachineLearningLM : Adaptation de l'apprentissage contextuel multi-coups via la préformation continue

La frontière de l'efficacité : ombres classiques contre images quantiques

BranchGRPO : GRPO stable et efficace avec ramification structurée dans les modèles de diffusion

Quantification de l'incertitude dans les modèles d'apprentissage automatique probabilistes : théorie, méthodes et perspectives

CURE : Désapprentissage contrôlé pour des intégrations robustes – Atténuation des raccourcis conceptuels dans les modèles de langage pré-entraînés

Révélation des précurseurs cachés des tremblements de terre grâce à une transformation sensible au stress du bruit sismique

ASE : une référence au niveau du référentiel pour évaluer la sécurité du code généré par l'IA

Comportements subjectifs et préférences en LLM : langue de navigation

Au-delà de dix tours : Débloquer la recherche agentique à long terme avec le RL asynchrone à grande échelle

SGDFuse : diffusion guidée par SAM pour la fusion d'images infrarouges et visibles haute fidélité

Modèles de langage auto-questionnés

MetaExplainer : un cadre pour générer des explications multi-types centrées sur l'utilisateur pour les systèmes d'IA

Comment devrions-nous méta-apprendre les algorithmes d’apprentissage par renforcement ?

ÉValuation complète des prototypes de réseaux neuronaux

HIRAG : Instruction de pensée hiérarchique - Réglage de la récupération - Génération augmentée

CyberRAG : un outil de classification et de reporting des cyberattaques Agentic RAG

Apprentissage par renforcement hiérarchique multi-échelles de temps pour un comportement et un contrôle unifiés de la conduite autonome

Un modèle de représentation non linéaire de bas rang avec un réseau neuronal convolutif pour l'imputation des données sur la qualité de l'eau

VIDÉO : Décomposition visuelle et interactive, exécution et évaluation de l'analyse de texte avec des agents intelligents

Diffusion discrète dans les grands langages et les modèles multimodaux : une étude

De la défense statique à la défense adaptative : défense multi-agents fédérée contre les attaques DoS dans les réseaux de drones en essaim, basée sur l'apprentissage par renforcement profond

À Quelle distance sommes-nous de l’efficacité optimale du raisonnement ?

Quel nom est mentionné ? Audit des recommandations des étudiants titulaires d'un master en droit

Critères d'arrêt pour l'itération de valeur sur les jeux simultanés d'accessibilité stochastique et de sécurité

Votre modèle de langage peut secrètement écrire comme les humains : attaques par paraphrase contrastive sur les détecteurs de texte générés par LLM

Ingénierie préalable rapide pour le réglage fin du renforcement

Les erreurs de raisonnement du modèle de langage de grande taille proviennent de caractéristiques de problèmes critiques hallucinantes

CoT-RAG : Intégration de la chaîne de pensée et de la génération augmentée par récupération pour améliorer le raisonnement dans les grands modèles linguistiques

TransitReID : collecte de données OD de transit avec réidentification dynamique des passagers résistante à l'occlusion

TerraMind : Multimodalité générative à grande échelle pour l'observation de la Terre

Boucles d'entraînement récursives dans les LLM : comment les propriétés des données d'entraînement modulent le changement de distribution dans les données générées ?

Mise à l'échelle des modèles de langage vidéo à 10 000 images via la distillation différentielle hiérarchique

Une approche théorique de la décision pour gérer l'incertitude en mécanique quantique

VIPER : Perception visuelle et raisonnement explicable pour la prise de décision séquentielle

LED : détection d'objets à vocabulaire ouvert améliorée LLM sans génération de données organisées par l'homme

Reangle-A-Video : Génération de vidéos 4D comme traduction vidéo-vidéo

Voir un monde dans une étincelle de neurone : démêler les interférences multitâches pour la fusion de modèles sans formation

UAR-NVC : un cadre autorégressif unifié pour la compression vidéo neuronale économe en mémoire

MPO : Optimiser les agents LLM grâce à l'optimisation des méta-plans

Attention aux perturbations du monde réel ! Évaluation de la robustesse naturelle en compréhension de lecture automatique

Un modèle de langage général pour l'identification des peptides

Au-delà des données visibles : amélioration de la généralisation KBQA grâce à la génération de formulaires logiques guidés par schéma

CoAT : Cadre de chaîne de pensées associées pour améliorer le raisonnement sur les grands modèles de langage

Attention à l’écart entre valeur et action : les LLM agissent-ils en accord avec leurs valeurs ?

Réparation de trajectoire conforme aux règles de circulation via les théories de la satisfaisabilité modulo et l'analyse de l'accessibilité

QR-VC : Exploitation des résidus de quantification pour le démêlage linéaire dans la conversion vocale Zero-Shot

IA générative pour l'augmentation des données dans les réseaux sans fil : analyse, applications et étude de cas

Inversion de compression de plage dynamique à amélioration neuronale : une approche hybride pour restaurer la dynamique audio

La quête du bon médiateur : étude de l'interprétabilité mécaniste à travers le prisme de l'analyse de la médiation causale

PriorCLIP : Modèle vision-langage guidé par prior visuel pour la récupération d'images et de textes par télédétection

Une approche de transformateur pour la prévision des prix de l'électricité

FedComLoc : Formation distribuée efficace en termes de communication pour les modèles clairsemés et quantifiés

PQMass : Évaluation probabiliste de la qualité des modèles génératifs à l'aide de l'estimation de masse probabiliste

HiPhO : Quelle est la distance entre les (M)LLM et les humains dans le dernier benchmark des Olympiades de physique au lycée ?

Vers un support décisionnel explicable utilisant des modèles neuronaux hybrides pour l'automatisation des terminaux logistiques

BlendedNet : un ensemble de données d'avions à fuselages multiples et un modèle de substitution pour les prévisions aérodynamiques

C'est tellement FETCH : élaboration de techniques d'ensemble pour la classification des LLM dans le cadre de l'admission et de l'orientation en droit civil

Les lois de Murphy sur l'alignement de l'IA : pourquoi l'écart est toujours gagnant

Surveillance adaptative et évaluation en conditions réelles des systèmes d'IA agentique

Combler le fossé en IA ophtalmique : ensemble de données MM-Retinal-Reason et modèle OphthaReason pour un raisonnement multimodal dynamique

Comprendre l'attention visuelle derrière la navigation des drones inspirée des abeilles

Travailler avec l'IA : mesurer l'applicabilité de l'IA générative aux professions

Mise à l'échelle de la planification LLM : NL2FLOW pour la génération de problèmes paramétriques et l'évaluation rigoureuse

Complétion de graphe de connaissances basée sur le contexte avec transmission de messages relationnels sensibles à la sémantique

Méta-sémantique Apprentissage relationnel augmenté en quelques coups

Perovskite-LLM : Modèles de langage étendus enrichis en connaissances pour la recherche sur les cellules solaires à pérovskite

Graphes de connaissances associatifs pour un stockage et une récupération efficaces des séquences

Planification épistémique limitée en profondeur

Une étude de l'apprentissage par renforcement pour les grands modèles de raisonnement

Piratage de grands modèles de langage : quantifier les risques cachés liés à l'utilisation de LLM pour l'annotation de texte

QCardEst/QCardCorr : estimation et correction de la cardinalité quantique

Distillation par fusion de pensées

MoVoC : Construction de sous-mots tenant compte de la morphologie pour les langages à écriture Geez

Mise à l'échelle de la vérité : le paradoxe de la confiance dans la vérification des faits par l'IA

PianoVAM : un ensemble de données multimodales sur les performances au piano

Un cadre d'apprentissage profond de bout en bout pour le diagnostic de l'arsenicose à l'aide d'images cutanées capturées sur mobile

Utilisation de l'IA pour optimiser le transfert des patients et l'utilisation des ressources lors d'incidents impliquant de nombreuses victimes : une plateforme de simulation

AgentGym-RL : Formation des agents LLM à la prise de décision à long terme grâce à l'apprentissage par renforcement multi-tours

Apprentissage des écoulements turbulents avec des modèles génératifs : super-résolution, prévision et reconstruction d'écoulements clairsemés

FinZero : lancement d'un système de prévision financière multimodale avec un modèle de raisonnement étendu

DEQuify votre champ de force : simulations plus efficaces grâce à des modèles d'équilibre profond

X-Teaming Evolutionary M2S : Découverte automatisée de modèles de jailbreak multi-tours à mono-tour

Explicabilité des modèles de classification basés sur CNN pour le signal acoustique

TANGO : Navigation sensible à la traversabilité avec contrôle des métriques locales pour les objectifs topologiques

Une architecture en couches pour l'analyse des journaux dans les systèmes informatiques complexes

Remodeler l'algorithme Forward-Forward avec un objectif basé sur la similarité

Reconnaissance de la langue des signes basée sur le squelette à l'aide d'un réseau convolutif de graphes dynamiques spatio-temporels à double flux

Apprentissage robuste des politiques d'état de croyance pour le routage des réseaux quantiques dans des conditions de décohérence et de variation temporelle

Architecture d'agents LLM résilients : Guide pour des implémentations sécurisées de type « planification puis exécution »

RoentMod : un modèle de modification de rayons X synthétique pour identifier et corriger les raccourcis du modèle d'interprétation d'image

UOPSL : Apprentissage des sites de prédilection OCT non appariés pour l'amélioration du diagnostic par imagerie du fond d'œil

OTESGN : Réseaux de graphes syntaxiques et sémantiques améliorés pour le transport optimal pour l'analyse des sentiments basée sur les aspects

Classification des comportements de mouvement sur 24 heures à partir des données d'accéléromètres portés au poignet : des fonctionnalités artisanales aux techniques d'apprentissage profond

Mémorisation dans les grands modèles linguistiques en médecine : prévalence, caractéristiques et implications

L'interprétabilité comme alignement : faire de la compréhension interne un principe de conception

MESH – Comprendre les vidéos comme les humains : mesurer les hallucinations dans les grands modèles vidéo

Piratage de grands modèles de langage : quantifier les risques cachés liés à l'utilisation de LLM pour l'annotation de texte

Created by

Haebom

Auteur

Joachim Baumann, Paul Rottger, Aleksandra Urman, Albert Wendsjo , Flor Miriam Plaza-del-Arco, Johannes B. Gruber, Dirk Hovy

Contour

Cet article aborde le problème du « piratage des LLM », qui survient lors de l'utilisation de modèles linguistiques à grande échelle (LLM) dans la recherche en sciences sociales. L'annotation des données et l'analyse de texte à l'aide de LLM peuvent varier considérablement selon les choix de mise en œuvre du chercheur, tels que le choix du modèle, la stratégie d'invite et les paramètres de température. Cela peut entraîner des biais systématiques et des erreurs aléatoires, entraînant des erreurs de type I, II, S et M. Les chercheurs ont reproduit 37 tâches d'annotation de données issues de 21 articles de recherche en sciences sociales à l'aide de 18 modèles différents, analysé 13 millions d'étiquettes LLM et testé 2 361 hypothèses afin de mesurer l'impact des choix du chercheur sur les conclusions statistiques. Les résultats ont montré que les modèles de pointe et les modèles linguistiques à petite échelle ont produit des conclusions erronées basées sur les données d'annotation LLM dans environ un tiers des hypothèses, tandis que les modèles à petite échelle ont produit environ la moitié des hypothèses. Des performances élevées aux tâches et des caractéristiques générales supérieures du modèle réduisent, sans toutefois les éliminer, le risque de piratage des LLM, et ce risque diminue à mesure que l'ampleur de l'effet augmente. De plus, nous démontrons que le piratage intentionnel des LLM peut être réalisé très simplement et que tout résultat peut être présenté comme statistiquement significatif avec seulement quelques LLM et quelques variations rapides. En conclusion, cela souligne l'importance de minimiser les erreurs dans la recherche en sciences sociales utilisant les LLM grâce à l'annotation humaine et à une sélection rigoureuse des modèles.

Takeaways, Limitations

•

Takeaways:

◦

Révéler quantitativement la gravité du problème de « piratage LLM » qui survient lors de l'application du LLM à la recherche en sciences sociales.

◦

Souligne l’importance de l’annotation humaine pour réduire le risque de piratage LLM.

◦

Plus la taille de l’effet est grande, plus le risque de piratage LLM est faible.

◦

Les résultats proches du seuil de signification statistique nécessitent une validation plus rigoureuse.

◦

Les techniques courantes de correction des estimations de régression sont inefficaces pour réduire le risque de piratage LLM.

◦

Révèle que le piratage délibéré du LLM est très facile.

•

Limitations:

◦

La généralisabilité du LLM et de l’ensemble de données utilisé dans l’analyse doit être examinée.

◦

Des recherches sont nécessaires sur des méthodologies plus efficaces pour atténuer les risques de piratage du LLM.

Voir le PDF

Made with Slashpage