Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Rétrosynthèse alignée sur les chimistes en assemblant divers modèles de biais inductifs

Created by
  • Haebom

Auteur

Krzysztof Maziarz, Guoqing Liu, Hubert Misztela, Austin Tripp, Junren Li, Alexeï Kornev, Piotr Gainski , Holger Hoefling, Mike Fortunato, Rishi Gupta, Marwin Segler

Contour

Cet article propose un nouveau modèle rétrosynthétique, RetroChimera, pour surmonter les limites des modèles de planification synthétique basés sur l'IA. RetroChimera repose sur deux composants nouvellement développés, dotés de biais inductifs complémentaires, combinés à l'aide d'un nouveau cadre intégrant des prédictions provenant de sources multiples via une stratégie d'ensemble basée sur l'apprentissage. Les résultats expérimentaux démontrent que RetroChimera surpasse significativement les principaux modèles existants, présente des performances robustes en dehors des données d'apprentissage et démontre, pour la première fois, sa capacité d'apprentissage même avec un très petit nombre d'exemples pour chaque classe de réaction. De plus, les chimistes organiques industriels préfèrent les prédictions de RetroChimera aux réactions des données d'apprentissage, démontrant ainsi un haut degré de cohérence. Enfin, le transfert sans injection sur un ensemble de données internes d'une grande entreprise pharmaceutique démontre une généralisation robuste sous décalage distributionnel.

Takeaways, Limitations_

Takeaways:
Résout efficacement les problèmes de réponse rare et de prédiction incorrecte des modèles de planification synthétique basés sur l'IA existants.
L’apprentissage est possible même avec de petites quantités de données, ce qui augmente l’efficacité des données.
Validation de la fiabilité et de la praticité du modèle grâce aux préférences des experts de l'industrie.
Capacité de généralisation améliorée et large applicabilité grâce au transfert zéro coup.
Des performances robustes sur une variété de tailles de données et de stratégies de partitionnement.
Présenter la possibilité d’accélérer le développement de modèles plus précis grâce à un cadre d’ensemble.
Limitations:
Les performances du modèle RetroChimera présentées dans cet article peuvent être limitées à des ensembles de données et à des conditions spécifiques.
Des recherches supplémentaires sont nécessaires pour évaluer l’interprétabilité et la fiabilité des résultats de prédiction du modèle.
Une validation supplémentaire de l’applicabilité et de l’évolutivité dans des environnements industriels réels est nécessaire.
👍