Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
LearnAlign : Sélection de données de raisonnement pour l'apprentissage par renforcement dans les grands modèles linguistiques, basée sur un alignement de gradient amélioré