Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Les utilités individuelles de la satisfaction de vie révèlent une aversion aux inégalités sans rapport avec l'alignement politique

DischargeSim : une simulation de référence pour la communication éducative médecin-patient à la sortie de l'hôpital

Régularisation de la gaussianité basée sur le spectre de moment et de puissance pour les modèles texte-image

Concept computationnel de la psyché (en russe)

MachineLearningLM : Adaptation de l'apprentissage contextuel multi-coups via la préformation continue

La frontière de l'efficacité : ombres classiques contre images quantiques

BranchGRPO : GRPO stable et efficace avec ramification structurée dans les modèles de diffusion

Quantification de l'incertitude dans les modèles d'apprentissage automatique probabilistes : théorie, méthodes et perspectives

CURE : Désapprentissage contrôlé pour des intégrations robustes – Atténuation des raccourcis conceptuels dans les modèles de langage pré-entraînés

Révélation des précurseurs cachés des tremblements de terre grâce à une transformation sensible au stress du bruit sismique

ASE : une référence au niveau du référentiel pour évaluer la sécurité du code généré par l'IA

Comportements subjectifs et préférences en LLM : langue de navigation

Au-delà de dix tours : Débloquer la recherche agentique à long terme avec le RL asynchrone à grande échelle

SGDFuse : diffusion guidée par SAM pour la fusion d'images infrarouges et visibles haute fidélité

Modèles de langage auto-questionnés

MetaExplainer : un cadre pour générer des explications multi-types centrées sur l'utilisateur pour les systèmes d'IA

Comment devrions-nous méta-apprendre les algorithmes d’apprentissage par renforcement ?

ÉValuation complète des prototypes de réseaux neuronaux

HIRAG : Instruction de pensée hiérarchique - Réglage de la récupération - Génération augmentée

CyberRAG : un outil de classification et de reporting des cyberattaques Agentic RAG

Apprentissage par renforcement hiérarchique multi-échelles de temps pour un comportement et un contrôle unifiés de la conduite autonome

Un modèle de représentation non linéaire de bas rang avec un réseau neuronal convolutif pour l'imputation des données sur la qualité de l'eau

VIDÉO : Décomposition visuelle et interactive, exécution et évaluation de l'analyse de texte avec des agents intelligents

Diffusion discrète dans les grands langages et les modèles multimodaux : une étude

De la défense statique à la défense adaptative : défense multi-agents fédérée contre les attaques DoS dans les réseaux de drones en essaim, basée sur l'apprentissage par renforcement profond

À Quelle distance sommes-nous de l’efficacité optimale du raisonnement ?

Quel nom est mentionné ? Audit des recommandations des étudiants titulaires d'un master en droit

Critères d'arrêt pour l'itération de valeur sur les jeux simultanés d'accessibilité stochastique et de sécurité

Votre modèle de langage peut secrètement écrire comme les humains : attaques par paraphrase contrastive sur les détecteurs de texte générés par LLM

Ingénierie préalable rapide pour le réglage fin du renforcement

Les erreurs de raisonnement du modèle de langage de grande taille proviennent de caractéristiques de problèmes critiques hallucinantes

CoT-RAG : Intégration de la chaîne de pensée et de la génération augmentée par récupération pour améliorer le raisonnement dans les grands modèles linguistiques

TransitReID : collecte de données OD de transit avec réidentification dynamique des passagers résistante à l'occlusion

TerraMind : Multimodalité générative à grande échelle pour l'observation de la Terre

Boucles d'entraînement récursives dans les LLM : comment les propriétés des données d'entraînement modulent le changement de distribution dans les données générées ?

Mise à l'échelle des modèles de langage vidéo à 10 000 images via la distillation différentielle hiérarchique

Une approche théorique de la décision pour gérer l'incertitude en mécanique quantique

VIPER : Perception visuelle et raisonnement explicable pour la prise de décision séquentielle

LED : détection d'objets à vocabulaire ouvert améliorée LLM sans génération de données organisées par l'homme

Reangle-A-Video : Génération de vidéos 4D comme traduction vidéo-vidéo

Voir un monde dans une étincelle de neurone : démêler les interférences multitâches pour la fusion de modèles sans formation

UAR-NVC : un cadre autorégressif unifié pour la compression vidéo neuronale économe en mémoire

MPO : Optimiser les agents LLM grâce à l'optimisation des méta-plans

Attention aux perturbations du monde réel ! Évaluation de la robustesse naturelle en compréhension de lecture automatique

Un modèle de langage général pour l'identification des peptides

Au-delà des données visibles : amélioration de la généralisation KBQA grâce à la génération de formulaires logiques guidés par schéma

CoAT : Cadre de chaîne de pensées associées pour améliorer le raisonnement sur les grands modèles de langage

Attention à l’écart entre valeur et action : les LLM agissent-ils en accord avec leurs valeurs ?

Réparation de trajectoire conforme aux règles de circulation via les théories de la satisfaisabilité modulo et l'analyse de l'accessibilité

QR-VC : Exploitation des résidus de quantification pour le démêlage linéaire dans la conversion vocale Zero-Shot

IA générative pour l'augmentation des données dans les réseaux sans fil : analyse, applications et étude de cas

Inversion de compression de plage dynamique à amélioration neuronale : une approche hybride pour restaurer la dynamique audio

La quête du bon médiateur : étude de l'interprétabilité mécaniste à travers le prisme de l'analyse de la médiation causale

PriorCLIP : Modèle vision-langage guidé par prior visuel pour la récupération d'images et de textes par télédétection

Une approche de transformateur pour la prévision des prix de l'électricité

FedComLoc : Formation distribuée efficace en termes de communication pour les modèles clairsemés et quantifiés

PQMass : Évaluation probabiliste de la qualité des modèles génératifs à l'aide de l'estimation de masse probabiliste

HiPhO : Quelle est la distance entre les (M)LLM et les humains dans le dernier benchmark des Olympiades de physique au lycée ?

Vers un support décisionnel explicable utilisant des modèles neuronaux hybrides pour l'automatisation des terminaux logistiques

BlendedNet : un ensemble de données d'avions à fuselages multiples et un modèle de substitution pour les prévisions aérodynamiques

C'est tellement FETCH : élaboration de techniques d'ensemble pour la classification des LLM dans le cadre de l'admission et de l'orientation en droit civil

Les lois de Murphy sur l'alignement de l'IA : pourquoi l'écart est toujours gagnant

Surveillance adaptative et évaluation en conditions réelles des systèmes d'IA agentique

Combler le fossé en IA ophtalmique : ensemble de données MM-Retinal-Reason et modèle OphthaReason pour un raisonnement multimodal dynamique

Comprendre l'attention visuelle derrière la navigation des drones inspirée des abeilles

Travailler avec l'IA : mesurer l'applicabilité de l'IA générative aux professions

Mise à l'échelle de la planification LLM : NL2FLOW pour la génération de problèmes paramétriques et l'évaluation rigoureuse

Complétion de graphe de connaissances basée sur le contexte avec transmission de messages relationnels sensibles à la sémantique

Méta-sémantique Apprentissage relationnel augmenté en quelques coups

Perovskite-LLM : Modèles de langage étendus enrichis en connaissances pour la recherche sur les cellules solaires à pérovskite

Graphes de connaissances associatifs pour un stockage et une récupération efficaces des séquences

Planification épistémique limitée en profondeur

Une étude de l'apprentissage par renforcement pour les grands modèles de raisonnement

Piratage de grands modèles de langage : quantifier les risques cachés liés à l'utilisation de LLM pour l'annotation de texte

QCardEst/QCardCorr : estimation et correction de la cardinalité quantique

Distillation par fusion de pensées

MoVoC : Construction de sous-mots tenant compte de la morphologie pour les langages à écriture Geez

Mise à l'échelle de la vérité : le paradoxe de la confiance dans la vérification des faits par l'IA

PianoVAM : un ensemble de données multimodales sur les performances au piano

Un cadre d'apprentissage profond de bout en bout pour le diagnostic de l'arsenicose à l'aide d'images cutanées capturées sur mobile

Utilisation de l'IA pour optimiser le transfert des patients et l'utilisation des ressources lors d'incidents impliquant de nombreuses victimes : une plateforme de simulation

AgentGym-RL : Formation des agents LLM à la prise de décision à long terme grâce à l'apprentissage par renforcement multi-tours

Apprentissage des écoulements turbulents avec des modèles génératifs : super-résolution, prévision et reconstruction d'écoulements clairsemés

FinZero : lancement d'un système de prévision financière multimodale avec un modèle de raisonnement étendu

DEQuify votre champ de force : simulations plus efficaces grâce à des modèles d'équilibre profond

X-Teaming Evolutionary M2S : Découverte automatisée de modèles de jailbreak multi-tours à mono-tour

Explicabilité des modèles de classification basés sur CNN pour le signal acoustique

TANGO : Navigation sensible à la traversabilité avec contrôle des métriques locales pour les objectifs topologiques

Une architecture en couches pour l'analyse des journaux dans les systèmes informatiques complexes

Remodeler l'algorithme Forward-Forward avec un objectif basé sur la similarité

Reconnaissance de la langue des signes basée sur le squelette à l'aide d'un réseau convolutif de graphes dynamiques spatio-temporels à double flux

Apprentissage robuste des politiques d'état de croyance pour le routage des réseaux quantiques dans des conditions de décohérence et de variation temporelle

Architecture d'agents LLM résilients : Guide pour des implémentations sécurisées de type « planification puis exécution »

RoentMod : un modèle de modification de rayons X synthétique pour identifier et corriger les raccourcis du modèle d'interprétation d'image

UOPSL : Apprentissage des sites de prédilection OCT non appariés pour l'amélioration du diagnostic par imagerie du fond d'œil

OTESGN : Réseaux de graphes syntaxiques et sémantiques améliorés pour le transport optimal pour l'analyse des sentiments basée sur les aspects

Classification des comportements de mouvement sur 24 heures à partir des données d'accéléromètres portés au poignet : des fonctionnalités artisanales aux techniques d'apprentissage profond

Mémorisation dans les grands modèles linguistiques en médecine : prévalence, caractéristiques et implications

L'interprétabilité comme alignement : faire de la compréhension interne un principe de conception

MESH – Comprendre les vidéos comme les humains : mesurer les hallucinations dans les grands modèles vidéo

HIRAG : Instruction de pensée hiérarchique - Réglage de la récupération - Génération augmentée

Created by

Haebom

Auteur

YiHan Jiao, ZheHao Tan, Dan Yang, DuoLin Sun, Jie Feng, Yue Shen, Jian Wang, Peng Wei

Contour

Cet article traite de la génération augmentée de recherche (RAG), devenue un paradigme fondamental pour relever les défis rencontrés par les modèles linguistiques à grande échelle (LLM) dans le traitement de l'information en temps réel et des problèmes spécifiques à un domaine. Les systèmes RAG existants s'appuient principalement sur les capacités d'apprentissage en contexte (ICL) du LLM lui-même, mais les recherches approfondies sur les capacités spécifiques requises pour les modèles de génération RAG font défaut, ce qui entraîne une qualité de document inégale et des systèmes de recherche défaillants. Même les recherches limitées sur l'optimisation des modèles de génération RAG manquent d'une approche granulaire des tâches RAG ni d'une compréhension approfondie du processus de la chaîne de pensée. Pour y remédier, cet article propose que les modèles RAG possèdent trois capacités hiérarchisées progressivement : (1) filtrage : la capacité de sélectionner les informations pertinentes ; (2) combinaison : la capacité de combiner des informations sémantiques entre les paragraphes ; et (3) inférence spécifique au RAG : la capacité de traiter ultérieurement les connaissances externes à partir des connaissances internes. Nous présentons donc la génération augmentée de récupération ajustée dirigée par la pensée hiérarchique (HIRAG), une nouvelle méthode de réglage fin dirigée par la RAG qui intègre une stratégie de « réflexion avant réponse ». Cette méthode s'appuie sur une chaîne de pensée progressive en plusieurs étapes pour améliorer la testabilité du modèle à livre ouvert. Les résultats expérimentaux montrent que la stratégie d'entraînement HIRAG améliore significativement les performances du modèle sur des jeux de données tels que RGB, PopQA, MuSiQue, HotpotQA et PubmedQA.

Takeaways, Limitations

•

Takeaways:

◦

Nous présentons l’importance d’un processus de réflexion hiérarchique (filtrage, combinaison et raisonnement spécifique au RAG) pour améliorer les performances des modèles RAG.

◦

Nous proposons une nouvelle méthode de réglage fin RAG appelée HIRAG et démontrons expérimentalement son amélioration des performances sur divers ensembles de données.

◦

Améliorer la capacité de test à livre ouvert du modèle grâce à la stratégie « réfléchir avant de répondre ».

•

Limitations:

◦

Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la méthode HIRAG proposée.

◦

Une validation supplémentaire est nécessaire pour déterminer si les améliorations de performances d’un ensemble de données spécifique peuvent être appliquées à d’autres ensembles de données.

◦

Augmentation potentielle des coûts de calcul en raison de la complexité du processus de la chaîne d’accident.

Voir le PDF

Made with Slashpage