StepFun-Prover Preview là một mô hình ngôn ngữ quy mô lớn được thiết kế để chứng minh định lý hình thức thông qua lập luận tích hợp công cụ. Sử dụng quy trình học tăng cường tích hợp các tương tác dựa trên công cụ, StepFun-Prover đạt hiệu suất mạnh mẽ trong việc tạo ra các bằng chứng Lean 4 với số lần lấy mẫu tối thiểu. Phương pháp này cho phép mô hình cải thiện các bằng chứng theo từng bước dựa trên phản hồi môi trường theo thời gian thực, mô phỏng các chiến lược giải quyết vấn đề giống con người. Trên bài kiểm tra chuẩn miniF2F, StepFun-Prover đạt tỷ lệ thành công pass@1 là 70,0%. Ngoài việc cải thiện hiệu suất chuẩn, chúng tôi giới thiệu một khuôn khổ đào tạo toàn diện để phát triển các mô hình lập luận tích hợp công cụ, gợi ý những hướng đi đầy hứa hẹn cho việc chứng minh định lý tự động và trợ lý AI toán học.