Bài báo này phân tích quy trình cộng nhiều chữ số trong mô hình LLaMA-3-8B-Instruct bằng cách kết hợp thăm dò tuyến tính và kiểm định thấu kính logit. Tương tự như phép cộng của con người, bài báo trình bày một quy trình phân cấp bao gồm bốn giai đoạn: giải mã tuyến tính biểu diễn cấu trúc toán học, hình thành các đặc điểm tính toán cốt lõi, trừu tượng hóa kết quả bằng số và tạo ra nghiệm cuối cùng. Điều này cho thấy mô hình dựa vào tính toán nội bộ hơn là ghi nhớ để thực hiện phép cộng nhiều chữ số. Mã và dữ liệu được công khai, giúp tăng cường khả năng tái tạo.