Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Cut2Next : Génération du plan suivant via un réglage contextuel

DIVER : une approche en plusieurs étapes pour la recherche d'informations intensive en raisonnement

Omni-Effects : Génération d'effets visuels unifiés et contrôlables spatialement

Chimera : Exploiter les LLM multi-agents pour la simulation automatique des menaces internes

Klear-Reasoner : amélioration des capacités de raisonnement grâce à l'optimisation de la politique de découpage préservant le gradient

TurboBias : biais de contexte ASR universel optimisé par un arbre de renforcement de phrases accéléré par GPU

AMFT : Alignement des raisonneurs LLM par méta-apprentissage de l'équilibre optimal imitation-exploration

LSDTs : LLM - Jumeaux numériques sémantiques augmentés pour la planification adaptative des infrastructures à forte intensité de connaissances

Les modèles biaisés ont-ils des pensées biaisées ?

Détection précoce du cancer du pancréas grâce à l'apprentissage multimodal sur le dossier médical électronique

LLM : désapprendre sans un ensemble de données organisé par des experts

Tableaux d'intégration multi-facettes pour le classement des publicités Pinterest

Echo : Découplage de l'inférence et de l'entraînement pour l'alignement RL à grande échelle sur des essaims hétérogènes

Infrastructures épitémiques situées : un cadre diagnostique pour les connaissances post-cohérence

RCR-Router : routage contextuel efficace et sensible aux rôles pour les systèmes LLM multi-agents avec mémoire structurée

Position : Le modèle actuel de conférence sur l'IA est intenable ! Diagnostic de la crise des conférences centralisées sur l'IA

GTPO et GRPO-S : mise en forme des récompenses au niveau des jetons et des séquences avec entropie des politiques

Quelques mots peuvent déformer les graphiques : attaques par empoisonnement des connaissances sur la récupération basée sur les graphiques – génération augmentée de grands modèles de langage

Explication des classificateurs de séries chronologiques avec PHAR : extraction et fusion de règles à partir d'attributions post-hoc

Modèles de langage sensibles aux rôles pour un contrôle d'accès sécurisé et contextualisé dans les organisations

DynaSwarm : Sélection dynamique de structures graphiques pour systèmes multi-agents basés sur LLM

Apprentissage post-achèvement pour les modèles linguistiques

Suppléants, rassemblez-vous ! Sélection des suppléants optimaux pour les assemblées citoyennes

Inspection Argus : les grands modèles linguistiques multimodaux possèdent-ils l'œil de Panoptes ?

RAGtifier : Évaluation des approches de génération RAG des systèmes RAG de pointe pour le concours SIGIR LiveRAG

Regroupement non supervisé de documents et de modèles à l'aide d'intégrations multimodales

Carte auto-organisatrice de saturation

Cadres culturels : évaluation de l'alignement des attentes culturelles dans les modèles texte-image et les indicateurs d'évaluation

Juger ou ne pas juger : utiliser les jugements LLM pour évaluer la pertinence des mots-clés des annonceurs sur eBay

Informatique collaborative Edge-Cloud sur l'intelligence distribuée et l'optimisation des modèles : une enquête

Mj\"olnir : un cadre de paramétrisation d'apprentissage profond pour la densité globale des éclairs

Apprentissage fédéré : une enquête sur l'intelligence collaborative préservant la confidentialité

Démocratie des modèles météorologiques numériques IA : un exemple de prévision mondiale avec FourCastNetv2 réalisé par un laboratoire de recherche universitaire utilisant le GPU

Génération augmentée par récupération avec des preuves contradictoires

SPIE : Post-formation sémantique et structurelle des modèles de diffusion d'édition d'images avec retour d'information de l'IA

ÉValuation de la confiance dans l'IA, les humains et les commentaires coproduits parmi les étudiants de premier cycle

ProtoECGNet : Apprentissage profond interprétable basé sur des cas pour la classification d'ECG multi-étiquettes avec apprentissage contrastif

ChatBench : des repères statiques à l'évaluation homme-IA

ÉLagage adaptatif du calcul pour le transformateur d'oubli

Harcèlement sexuel induit par l'IA : étude des caractéristiques contextuelles et des réactions des utilisateurs face au harcèlement sexuel induit par un chatbot compagnon

CrossWordBench : Évaluation des capacités de raisonnement des LLM et des LVLM avec génération de puzzles contrôlables

Reconnaissance d'entités nommées opioïdes (ONER-2025) de Reddit

OSMa-Bench : Évaluation de la cartographie sémantique ouverte dans des conditions d'éclairage variables

TIDE : Autoencodeurs clairsemés sensibles au temps pour les transformateurs de diffusion interprétables dans la génération d'images

Contrôle préfrontal flexible sur la mémoire épisodique hippocampique pour la généralisation dirigée vers un objectif

EvoP : Inférence LLM robuste via l'élagage évolutif

Nuits blanches, journées sucrées : créer des utilisateurs synthétiques présentant des problèmes de santé pour des interactions réalistes avec les agents de coaching

Annotation des émotions à zéro plan dans les images faciales à l'aide de grands modèles multimodaux : analyse comparative et perspectives pour les approches multi-classes et multi-images

PAR-AdvGAN : Amélioration de la capacité d'attaque adverse grâce à l'auto-régression progressive AdvGAN

Oubliez les données et les réglages ! Pliez simplement le réseau pour compresser

FBFL : une approche de coordination basée sur le terrain pour l'hétérogénéité des données dans l'apprentissage fédéré

Régression basée sur le décodage

AdEval : évaluation dynamique basée sur l'alignement pour atténuer la contamination des données dans les grands modèles linguistiques

Rétrosynthèse alignée sur les chimistes en assemblant divers modèles de biais inductifs

Réseaux neuronaux profonds adaptatifs et informés pour l'analyse des flux de puissance

Une taxonomie des risques et un outil de réflexion pour l'adoption de modèles linguistiques à grande échelle en santé publique

Apprentissage des schémas vocaux des ouistitis avec un autoencodeur masqué pour une segmentation, une classification et une identification de l'appelant robustes

Accès au spectre dynamique pour les systèmes D2D assistés par communication par rétrodiffusion ambiante avec apprentissage par renforcement quantique

Généralisation sans augmentation de données du RL basé sur la vision

Génération de mouvement basée sur un hypergraphe avec raisonnement relationnel d'interaction multimodale

3DFacePolicy : Animation faciale 3D pilotée par l'audio et basée sur le contrôle des actions

Prédiction du rendement pour la sélection de portefeuilles moyenne-variance : comment l'apprentissage axé sur la décision façonne les modèles de prévision

OE3DIS : segmentation d'instances de nuages de points 3D ouverts

VisionUnite : un modèle de base vision-langage pour l'ophtalmologie enrichi de connaissances cliniques

DreamStory : Visualisation d'histoires en domaine ouvert par diffusion cohérente multi-sujets guidée par LLM

MEReQ : Max-Ent Residual-Q Inverse RL pour un alignement efficace des échantillons à partir d'une intervention

Coefficient adaptatif multidimensionnel pour l'optimisation de la trajectoire d'inférence en flux et en diffusion

AIOS : système d'exploitation de l'agent LLM

Gardez vos amis proches : exploiter les groupes d'affinité pour accélérer les flux de travail d'inférence de l'IA

Du laboratoire au terrain : évaluation en conditions réelles d'une solution vidéo intelligente basée sur l'IA pour améliorer la sécurité communautaire

BELLA : Explications du modèle de boîte noire par approximations linéaires locales

Logiciel d'intelligence artificielle structuré pour simuler la mémoire de travail humaine, l'imagerie mentale et la continuité mentale

Ajuster les ontologies logiques de description aux exemples de requêtes et d'ABox

Interpréter le discours de la Fed avec confiance : un cadre de réflexion sur l'incertitude basé sur un LLM et guidé par les trajectoires de transmission de la politique monétaire

Conception d'un système d'aide à la décision basé sur la rétroaction pour une intervention dynamique auprès des étudiants

Les grands modèles linguistiques ne simulent pas la psychologie humaine

IRL-VLA : Formation à une politique Vision-Langage-Action via le modèle mondial de récompense

InfiAlign : un cadre évolutif et efficace en termes d'échantillons pour aligner les LLM afin d'améliorer les capacités de raisonnement

SEAgent : Agent d'utilisation d'ordinateur auto-évolutif avec apprentissage autonome par l'expérience

Masque dynamique entraînable Attention clairsemée

Fusion de données de capteurs multimodaux basés sur la périphérie avec des modèles de langage de vision (VLM) pour éviter les accidents de véhicules autonomes en temps réel

Cognitive Kernel-Pro : un cadre pour la formation des agents de recherche approfondie et des modèles de fondation d'agents

Reconnaissance probabiliste active des objectifs

Quand l'apprentissage par imitation surpasse l'apprentissage par renforcement dans la planification des interventions chirurgicales

ÉQuité consciente de l'effort : intégration d'une notion d'effort centrée sur l'humain et éclairée par la philosophie dans les mesures d'équité algorithmique

UnrealZoo : enrichir les mondes virtuels photoréalistes pour l'IA incarnée

Raisonnement Système~2 pour l'alignement humain-IA : généralité et adaptabilité via ARC-AGI

Le temps est une caractéristique : exploiter la dynamique temporelle dans les modèles de langage de diffusion

ÉDition couleur guidée par texte sans formation avec transformateur de diffusion multimodale

Vers l'inférence neuronale universelle

SPARC : Modèle de recherche multi-intérêts adaptatif probabiliste souple via des livres de codes pour système de recommandation

Fusion multimodale dynamique sensible aux incertitudes pour la surveillance de la santé en extérieur

Pouvons-nous faire confiance à l'IA pour gouverner l'IA ? Analyse comparative des performances des LLM aux examens sur la confidentialité et la gouvernance de l'IA.

Traces spatiales : améliorer les modèles VLA grâce à une compréhension spatio-temporelle

E3-Réécriture : Apprendre à réécrire SQL pour l'exécutabilité, l'équivalence et l'efficacité

Quand les deepfakes semblent réels : détection des visages générés par l'IA avec des données non étiquetées en raison de problèmes d'annotation

Attaques et défenses contre l'empreinte digitale LLM

LyS à SemEval 2025 Tâche 8 : Génération de code Zero-Shot pour l'assurance qualité tabulaire

Attention clairsemée rétrospective pour une génération efficace de contexte long

Raisonnement rationnel inverse

Placement et migration d'agents d'IA adaptatifs dans les systèmes d'intelligence périphérique

Created by

Haebom

Auteur

Xingdan Wang, Jiayi He, Zhiqing Tang, Jianxiong Guo, Jiong Lou, Liping Qian, Tian Wang, Weijia Jia

Contour

Cet article présente un système permettant de déployer et de gérer efficacement des agents d'IA basés sur des modèles de langage à grande échelle (LLM), tels que ChatGPT et Claude, dans des environnements périphériques dynamiques. Pour relever les défis de latence élevée des déploiements cloud, nous souhaitons déployer des agents d'IA dans des environnements périphériques. Compte tenu de la nature limitée et hétérogène des ressources périphériques, nous modélisons les contraintes de ressources et la latence/coûts. Nous proposons un cadre adaptatif utilisant l'algorithme de colonie de fourmis et l'optimisation basée sur les LLM. Ce système automatise le déploiement et la migration des agents, optimise l'utilisation des ressources et la qualité de service (QoS), et permet une migration légère des agents ne transmettant que l'état essentiel. Implémenté dans un système distribué utilisant AgentScope, le système a été validé sur des serveurs périphériques répartis à l'échelle mondiale, démontrant des réductions significatives de la latence de déploiement et des coûts de migration.

Takeaways, Limitations

•

Takeaways:

◦

Présentation de la première solution systématique pour le déploiement et la gestion d'un environnement de périphérie dynamique d'agents d'IA basés sur LLM.

◦

Une stratégie efficace de placement et de migration d'agents utilisant l'algorithme de colonie de fourmis et l'optimisation basée sur LLM.

◦

Réduisez les coûts et améliorez l’efficacité grâce à une migration d’agents légère.

◦

Prouver la praticité grâce à la mise en œuvre réelle d'un système distribué et à la vérification globale du serveur de périphérie.

◦

Réduction vérifiée de la latence de déploiement et des coûts de migration

•

Limitations:

◦

Une vérification supplémentaire de l’évolutivité du cadre proposé est nécessaire.

◦

Une évaluation de l’applicabilité est nécessaire pour différents types d’appareils périphériques et d’environnements réseau.

◦

Nécessité de contre-mesures pour résoudre les problèmes de perte de données et de cohérence qui peuvent survenir lors de la migration de l'agent.

◦

Une analyse de la consommation d’énergie et de la dégradation des performances des appareils périphériques est nécessaire.

Voir le PDF

Made with Slashpage