Bài báo này đề xuất một kỹ thuật chịu lỗi hiệu quả cho các lỗi mềm xảy ra trong quá trình suy luận của mô hình Transformer. Các khuôn khổ chịu lỗi hiện có dựa trên các đơn vị tính toán gặp phải vấn đề đáng kể về chi phí tính toán và bộ nhớ, cũng như khả năng mở rộng hạn chế. Bài báo này giải quyết những vấn đề này bằng cách xử lý các phép tính trong mô-đun attention như một hạt nhân duy nhất, triển khai khả năng chịu lỗi đầu cuối. Bài báo cung cấp khả năng bảo vệ lỗi toàn diện cho các phép toán phi tuyến tính và thiết kế một thuật toán chịu lỗi dựa trên bước nhảy (ABFT) cho các mô-đun tuyến tính để tránh giao tiếp giữa các luồng. Kết quả thử nghiệm cho thấy tốc độ tăng lên tới 7,56 lần so với các phương pháp hiện có, với chi phí chịu lỗi trung bình là 13,9%.