Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Superintelligence ascendante spécifique au domaine : un graphe de connaissances fiable est ce dont nous avons besoin

Created by
  • Haebom

Auteur

Bhishma Dedhia, Yuval Kansal, Niraj K.Jha

Contour

Bien que les modèles de langage existants pour la généralisation inter-domaines aient démontré des capacités de raisonnement pour des tâches spécifiques, l'apprentissage ascendant utilisant des corpus généraux est insuffisant pour acquérir les capacités d'abstraction requises pour une expertise approfondie du domaine. Cette étude propose une approche descendante qui permet d'acquérir une expertise en apprenant à organiser des concepts de domaine simples en concepts plus complexes. Un graphe de connaissances (GC) représente les primitives du domaine sous forme d'arêtes tête-relation-queue, et les chemins codent les concepts de niveau supérieur, fournissant cette structure d'organisation. Cette étude présente un pipeline de génération de tâches qui génère des tâches directement à partir des primitives GC, permettant au modèle de les acquérir et de les organiser pour l'inférence. En nous concentrant sur le domaine médical, nous utilisons des GC médicaux pour organiser 24 000 tâches de raisonnement avec des processus de pensée dérivés de diverses primitives médicales. Nous avons ensuite affiné le modèle QwQ-32B avec ce programme pour obtenir le QwQ-Med-3, une étape vers la superintelligence en médecine. Nous introduisons également l'ICD-Bench, un ensemble d'évaluations qui quantifie les capacités de raisonnement dans 15 domaines médicaux. Les résultats expérimentaux démontrent que QwQ-Med-3 surpasse significativement les modèles d'inférence de pointe dans la catégorie ICD-Bench, exploitant les fondamentaux acquis pour combler son écart de performance sur les tâches ICD-Bench les plus complexes. L'évaluation sur des benchmarks de questions-réponses médicales démontre que QwQ-Med-3 transfère son expertise acquise pour améliorer les performances des modèles sous-jacents. Alors que les approches industrielles de l'intelligence artificielle générale (IAG) privilégient une expertise large, cette recherche suggère un avenir où l'IAG émergera des interactions configurables d'agents superintelligents, efficaces et spécifiques à un domaine.

Takeaways, Limitations_

Takeaways:
Nous démontrons que des modèles de superintelligence spécifiques à un domaine peuvent être construits en utilisant une approche d’apprentissage descendante basée sur des graphes de connaissances.
Présentation du modèle QwQ-Med-3 et de l'ensemble d'évaluation ICD-Bench, qui démontrent des performances exceptionnelles dans le domaine médical.
Vérifier le potentiel d’apprentissage par transfert des connaissances acquises dans le domaine.
Présentation de la possibilité de mettre en œuvre l'AGI via des interactions configurables d'agents superintelligents spécifiques à un domaine.
Limitations:
Actuellement, il est spécialisé dans le domaine médical et des recherches supplémentaires sont nécessaires pour déterminer sa généralisabilité à d’autres domaines.
La qualité et l’exhaustivité du graphe de connaissances utilisé peuvent affecter les performances du modèle.
Il est nécessaire d’évaluer des tâches de raisonnement médical plus diverses et plus complexes.
Des recherches sur des mécanismes spécifiques d’interactions entre des agents superintelligents spécifiques à un domaine sont nécessaires pour parvenir à l’AGI.
👍