Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, Dakota Mahan, Jeffrey Quesnelle, Joe Li, Chen Guang, Shannon Sands, Karan Malhotra
Contour
Hermes 4 est une famille de modèles d'inférence hybrides combinant une inférence multithread structurée à des capacités étendues de suivi d'instructions. Nous décrivons les défis rencontrés lors de la curation, de la synthèse, de l'entraînement et de l'évaluation des données, ainsi que les solutions mises en œuvre pour les relever. Nous présentons des résultats d'évaluation complets sur les benchmarks de raisonnement mathématique, de codage, de connaissances, de compréhension et d'alignement, ainsi que sur les performances quantitatives et l'analyse comportementale qualitative. Toutes les pondérations des modèles sont accessibles au public sur https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728 .
Nous présentons une implémentation efficace d’un modèle hybride qui combine une inférence multithread structurée avec la capacité de suivre des instructions générales.
◦
ÉValuation complète des performances et résultats d'analyse quantitative et qualitative à travers différents benchmarks.
◦
Soutenir la recherche ouverte par la divulgation des pondérations des modèles.
•
Limitations:
◦
Le document manque de descriptions détaillées de la conservation spécifique des données, de la synthèse, du processus de formation et des solutions.
◦
Manque d’explication claire des types et des limites des critères d’évaluation.
◦
Manque d’analyse des problèmes potentiels qui pourraient entraîner une dégradation des performances du modèle.