Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Raisonnement par rétro-ingénierie pour une génération ouverte

Created by
  • Haebom

Auteur

Haozhe Wang, Haoran Que, Qixin Xu, Minghao Liu, Wangchunshu Zhou, Jiazhan Feng, Wanjun Zhong, Wei Ye, Tong Yang, Wenhao Huang, Ge Zhang, Fangzhen Lin

Contour

Cet article aborde les défis liés à l'application du paradigme de l'« inférence profonde », qui a permis des avancées significatives dans des domaines vérifiables comme les mathématiques, au domaine génératif ouvert et créatif. Les méthodes existantes d'apprentissage par renforcement et de distillation des connaissances peinent dans ce domaine en raison de l'absence de signaux de récompense clairs, de la difficulté à construire des modèles de récompense de haute qualité et du coût élevé et des limitations de performance des modèles pédagogiques. Pour surmonter ces défis, cet article présente un nouveau paradigme : l'inférence par rétro-ingénierie (REER). Au lieu de construire le processus d'inférence « en avant » par essais et erreurs ou imitation, la REER fonctionne « en arrière », en partant d'une solution éprouvée et en découvrant par calcul, étape par étape, les chemins d'inférence profonde potentiels qui pourraient générer cette solution. Grâce à cette approche évolutive et sans gradient, nous créons et publions DeepWriting-20K, un jeu de données à grande échelle contenant des chemins d'inférence profonde pour 20 000 tâches open source. Le modèle DeepWriter-8B formé sur cet ensemble de données surpasse non seulement les principaux modèles de base open source existants, mais atteint également des performances comparables, voire parfois supérieures, à celles des modèles propriétaires de pointe tels que GPT-4o et Claude 3.5.

Takeaways, Limitations

Takeaways:
Contribue à améliorer les performances des modèles d'inférence profonde dans le domaine de la génération créative ouverte en proposant un nouveau paradigme appelé inférence d'ingénierie inverse (REER).
Contribuez aux recherches futures en publiant l'ensemble de données de chemin d'inférence profonde à grande échelle DeepWriting-20K.
Le modèle DeepWriter-8B démontre des performances compétitives avec les modèles open source et propriétaires de premier plan existants.
Limitations:
Des recherches supplémentaires sont nécessaires pour déterminer si la REER peut être appliquée à tous les types de tâches créatives génératives ouvertes.
D’autres améliorations sont nécessaires pour améliorer l’échelle et la diversité de l’ensemble de données DeepWriting-20K.
Une validation supplémentaire est nécessaire pour déterminer dans quelle mesure la méthode REER se généralise à d’autres types de problèmes d’inférence.
👍