Cet article étudie l'apprentissage d'une correspondance réponse-invite, où un générateur invariant dans le temps parcourt plusieurs étapes pour générer une chaîne de pensée, étant donné une classe de base générant une séquence de jetons, le jeton final servant de réponse. Nous formulons le problème d'apprentissage pour les cas où le processus de pensée est observé et ceux où il est appris uniquement à partir de paires réponse-invite (lorsque le processus de pensée est latent). Nous analysons ensuite la complexité d'échantillonnage et de calcul pour des classes de base spécifiques, telles que leurs propriétés générales (par exemple, la dimension VC) et les seuils linéaires. Nous présentons une classe de base simple qui permet l'apprentissage d'une chaîne de pensée universellement représentable et exploitable par calcul, et dont la complexité d'échantillonnage est indépendante de la longueur de la chaîne grâce à son invariance dans le temps. L'attention est naturellement introduite dans cette étude.