[공지사항]을 빙자한 안부와 근황

Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Apprentissage fédéré efficace avec données hétérogènes et abandon adaptatif

Efficacité énergétique de l'IA pour la 5G et au-delà : une étude de cas DeepRx

Un cadre PBN-RL-XAI pour la découverte d'une stratégie thérapeutique « hit-and-run » dans le mélanome

Couture de modèles de fondation en modalité (presque) libre

Prompt4Trust : un cadre d'augmentation des invites d'apprentissage par renforcement pour un étalonnage de la confiance cliniquement aligné dans les modèles multimodaux de langage volumineux

SEALGuard : protection des conversations multilingues en langues d'Asie du Sud-Est pour les systèmes logiciels LLM

Adaptation de la dérive hiérarchique duale pour l'apprentissage des performances de configuration en ligne

L'estimateur de Parzen structuré en arbre peut résoudre plus efficacement l'optimisation combinatoire en boîte noire

EXPO : Apprentissage par renforcement stable avec politiques expressives

Apprentissage par renforcement avec segmentation d'actions

Sur l'effet de la perte d'accord de l'instruction sur la généralisation

Stations d'hallucinations : sur certaines limites fondamentales des modèles de langage basés sur les transformateurs

Texte vers modèle via SysML : génération automatisée de modèles informatiques de systèmes dynamiques à partir de texte en langage naturel non structuré via des diagrammes de langage de modélisation de système améliorés

Apprentissage basé sur les fonctionnalités ou basé sur le GAN à partir de démonstrations : quand et pourquoi

DRAGON : Benchmark RAG dynamique sur l'actualité

Prévision des éruptions solaires à l'aide de la mémoire à long terme (LSTM) et de la décomposition LSTM avec reconnaissance de formes par fenêtre glissante

Forêts de conversation : la clé pour affiner les modèles de langage volumineux destinés aux conversations médicales multi-tours réside dans la ramification.

RAG-R1 : Stimuler les capacités de recherche et de raisonnement des LLM grâce au parallélisme multi-requêtes

Suivre les indices : expériences sur la réidentification des personnes à l'aide de l'intelligence intermodale

La stylométrie reconnaît les textes humains et générés par LLM dans de courts échantillons

QLPro : découverte automatisée des vulnérabilités de code via LLM et intégration de l'analyse de code statique

ÉValuation des modèles linguistiques multimodaux à grande échelle dans les manuels scolaires

FeDa4Fair : Ensembles de données fédérés au niveau client pour l'évaluation de l'équité

Atténuer les biais liés à la sensibilité de l'utilisateur grâce à un modèle de recommandation séquentielle générative équitable

MATE : LLM - Environnement de traduction multi-agents optimisé pour les applications d'accessibilité

DeInfoReg : un cadre d'apprentissage découplé pour un meilleur rendement de formation

FLAME : Vers un affinement fédéré des grands modèles de langage grâce à SMoE adaptatif

ImpliRet : Analyse comparative du défi de la recherche de faits implicites

Le prix de la liberté : explorer les compromis entre expressivité et temps d'exécution dans les produits tensoriels équivariants

Les limites de la marginalisation traitable

Un cadre sémantique quantique pour le traitement du langage naturel

ProtocolLLM : Benchmark RTL pour la génération de protocoles de communication SystemVerilog

La technologie Deepfake dévoilée : la marchandisation de l'IA et son impact sur la confiance numérique

Dynamique d'apprentissage sous-jacente aux lois d'échelle des modèles de langage : décélération des pertes et apprentissage à somme nulle

Critique-GRPO : Faire progresser le raisonnement LLM grâce au langage naturel et au retour numérique

Matrix est tout ce dont vous avez besoin

Le découpage temporel améliore la reconnaissance des modèles séquentiels implicites

Sept défis de sécurité à résoudre dans les systèmes LLM multi-agents inter-domaines

PAN-Crafter : alignement cohérent des modalités d'apprentissage pour l'affinement du PAN

FlowAlign : Édition d'images basée sur le flux, régularisée par trajectoire et sans inversion

Voyager à travers les langues : évaluation de la cohérence interlinguistique dans les LLM multimodaux

FalseReject : une ressource pour améliorer la sécurité contextuelle et atténuer les refus excessifs dans les LLM grâce au raisonnement structuré

Analyse des sentiments multimodaux sur l'ensemble de données CMU-MOSEI à l'aide de modèles basés sur des transformateurs

Nexus-Gen : Compréhension, génération et édition d'images unifiées via une autorégression préremplie dans un espace d'intégration partagé

Exploiter de grands modèles linguistiques pour la détection multi-classes et multi-étiquettes de la consommation de drogues et des symptômes de surdose sur les réseaux sociaux

Repenser les fondements de l'apprentissage par renforcement continu

Flux de composition pour la co-conception de molécules 3D et de voies de synthèse

Repenser RoPE : un modèle mathématique pour l'intégration positionnelle à N dimensions

Refactorisation spéculative automatisée de programmes d'apprentissage profond impératifs pour l'exécution graphique

Adaptation au temps de test pour le modèle de segmentation médicale de base sans mises à jour paramétriques

Le style avant le fond : les modèles de langage distillés raisonnent via la réplication stylistique

Ensemble de données AnnoPage : ensemble de données d'éléments non textuels dans des documents avec catégorisation fine

ÉLagage des nœuds multi-vues pour une représentation graphique précise

Salut Robot : Suivi d'instructions ouvert avec modèles hiérarchiques vision-langage-action

Vote ou consensus ? Prise de décision dans un débat multi-agents

Assistance ou perturbation ? Exploration et évaluation de la conception et des compromis d'un soutien proactif à la programmation de l'IA

Une approche générative de la détection de la nocivité des LLM avec des jetons d'alerte spéciaux

Entraînement par score de mélange : apprentissage de modèles génératifs en une étape simplifié grâce à l'estimation du score des distributions de mélange

Les attaques de falsification de modèles permettent des évaluations plus rigoureuses des capacités LLM

Ensembles de données synthétiques pour l'apprentissage automatique sur des graphes spatio-temporels utilisant des EDP

Comply : Apprendre des phrases avec des poids complexes inspirées de l'olfaction des mouches à fruits

Apprentissage par renforcement inverse avec commutation des récompenses et dépendance à l'historique pour caractériser les comportements animaux

Reconnaissance de signaux radar à faible intensité grâce à l'apprentissage auto-supervisé et à l'adaptation au domaine des radiofréquences

Analyse de l'apprentissage par transfert des circuits quantiques variationnels

Plancraft : un ensemble de données d'évaluation pour la planification avec des agents LLM

Modélisation du comportement humain entièrement basée sur les données mais interprétable avec un modèle de choix discret différentiable

Une revue de la quantification bayésienne de l'incertitude dans la segmentation d'images probabilistes profondes

La qualité ou la quantité des données de formation a-t-elle plus d’impact sur les performances des petits modèles linguistiques ?

Recherche d'espaces de programmes latents

Les cadres pragmatiques des corrélations parasites en apprentissage automatique : interpréter leur importance et leur importance

ComFairGNN : réseau neuronal graphique de foire communautaire

DroidSpeak : partage de cache KV pour la communication inter-LLM et la diffusion multi-LLM

Récompenses intrinsèques en ligne pour les agents décisionnaires à partir des retours d'expérience sur les modèles de langage à grande échelle

Les grands modèles de langage génèrent trop de fonctionnalités simples pour les données tabulaires

Surmonter les fréquences de décision lentes en contrôle continu : apprentissage par renforcement séquentiel basé sur un modèle pour un contrôle sans modèle

IdeaSynth : Développement d'idées de recherche itérative par l'évolution et la composition de facettes d'idées avec des commentaires fondés sur la littérature

SÉCURISÉ : Conversation incarnée consciente de la sémantique sous l'inconscience pour un apprentissage robotique tout au long de la vie

Modèle avancé de profondeur pour l'estimation monoculaire non supervisée de la profondeur en endoscopie

SA-GDA : Augmentation spectrale pour l'adaptation au domaine graphique

La surprise GPT : proposer un modèle de chat linguistique volumineux dans une classe de codage massive a réduit l'engagement mais augmenté les performances des utilisateurs aux examens

Apprentissage par renforcement hors ligne avec contraintes d'état

SimAD : une approche simple basée sur la dissimilarité pour la détection des anomalies de séries chronologiques

Analyse ODE unifiée des algorithmes d'apprentissage Q-Learning fluides

FairTargetSim : un simulateur interactif pour comprendre et expliquer les effets d'équité de la définition des variables cibles

Exploration fine des connaissances avec état : récupération efficace et efficiente de graphes avec de grands modèles de langage

Apprentissage de modèles d'action de planification numérique sûrs

Amélioration de la prédiction de l'angle de braquage de bout en bout avec les données du bus CAN

PÂQUES : Intégration de modèles hétérogènes basés sur l'agrégation, formation à l'apprentissage fédéré vertical

GRAPES : Apprendre à échantillonner des graphes pour des réseaux neuronaux graphes évolutifs

Acquisition et adaptation des priors pour de nouvelles tâches via des méta-architectures neuronales

VerifyBench : une référence systématique pour l'évaluation des vérificateurs de raisonnement dans différents domaines

Les données écrites par des humains sont-elles suffisantes ? Le défi d'enseigner le raisonnement aux étudiants en master sans apprentissage par renforcement ni distillation

Travailler avec l'IA : mesurer les implications professionnelles de l'IA générative

ÉTablir les meilleures pratiques pour créer des benchmarks agentiques rigoureux

Un cadre agentique pour la modélisation autonome des métamatériaux et la conception inverse

À La recherche d'une collision : génération de scénarios critiques en ligne pour la conduite autonome avec récupération de modèles de langage augmentés à grande échelle

BOOST : Amorçage de programmes de raisonnement axés sur la stratégie pour une vérification des faits guidée par programme

L'Odyssée du plus apte : les agents peuvent-ils survivre et rester bons ?

Raisonnement agentique : un cadre simplifié pour améliorer le raisonnement LLM avec des outils agentiques

ZebraLogic : sur les limites d'évolutivité des LLM pour le raisonnement logique

Recherche d'espaces de programmes latents

Created by

Haebom

Auteur

Matthew V Macfarlane, Clément Bonnet

Contour

Dans cet article, nous proposons une nouvelle architecture, le réseau de programmes latents (LPN). Le LPN combine la puissance de généralisation de la synthèse de programmes avec l'évolutivité de l'apprentissage profond en intégrant la recherche directe dans le modèle neuronal au moment du test. Pour résoudre le problème d'explosion combinatoire des méthodes de synthèse de programmes existantes et le manque d'adaptabilité au moment du test des méthodes d'apprentissage profond, le LPN apprend un espace latent de programmes implicites qui mappe les entrées aux sorties, et effectue une recherche dans cet espace à l'aide de gradients au moment du test. Il affiche des performances comparables, voire supérieures, aux méthodes existantes sur diverses tâches de programmation par exemples, sans nécessiter de langage spécifique prédéfini, et démontre sa capacité à apprendre et à explorer l'espace latent des programmes pour s'adapter à de nouvelles tâches sur le benchmark ARC-AGI. L'activation de la recherche au moment du test améliore les performances d'un facteur deux sur les tâches hors distribution.

Takeaways, Limitations

•

Takeaways:

◦

Nous présentons une nouvelle architecture LPN qui combine les avantages de la synthèse de programmes et de l'apprentissage en profondeur.

◦

Adaptabilité améliorée aux tâches hors distribution grâce à la recherche au moment du test.

◦

Dépendance réduite aux langages prédéfinis spécifiques au domaine.

◦

Validation de la praticité par des améliorations de performances sur le benchmark ARC-AGI.

•

Limitations:

◦

Des recherches supplémentaires sont nécessaires sur la taille de l’espace latent et l’efficacité de recherche du LPN.

◦

D’autres évaluations de performance de généralisation pour différents types de tâches sont nécessaires.

◦

Une analyse de la complexité et du coût de calcul du LPN est nécessaire.

Made with Slashpage