Bài báo này xem xét việc học một ánh xạ gợi ý-trả lời, trong đó một bộ tạo bất biến theo thời gian lặp lại qua nhiều bước để tạo ra một chuỗi suy nghĩ, cho trước một lớp cơ sở tạo ra một chuỗi các mã thông báo và mã thông báo cuối cùng được sử dụng làm câu trả lời. Chúng tôi xây dựng bài toán học cho cả hai trường hợp trong đó quá trình suy nghĩ được quan sát và các trường hợp trong đó quá trình suy nghĩ chỉ được học từ các cặp gợi ý-trả lời (khi quá trình suy nghĩ là tiềm ẩn), và phân tích độ phức tạp của mẫu và tính toán cho các lớp cơ sở cụ thể, chẳng hạn như các thuộc tính chung của lớp cơ sở (ví dụ: chiều VC) và ngưỡng tuyến tính. Chúng tôi trình bày một lớp cơ sở đơn giản cho phép học một chuỗi suy nghĩ có thể biểu diễn phổ quát và có thể xử lý được bằng tính toán, và độ phức tạp của mẫu của nó không phụ thuộc vào độ dài của chuỗi suy nghĩ do tính bất biến theo thời gian của nó. Sự chú ý được đưa vào một cách tự nhiên trong nghiên cứu này.