StepFun-Prover Previewは、ツール統合の推論を通じて形式的なクリーンアップを証明するために設計された大規模な言語モデルです。ツールベースの相互作用を統合する強化学習パイプラインを使用して、StepFun-Proverは最小限のサンプリングでLean 4証明を生成するための強力なパフォーマンスを実現します。このアプローチにより、モデルはリアルタイム環境フィードバックに基づいて証明を繰り返し改善し、人間と同様のトラブルシューティング戦略をエミュレートできます。 miniF2F-testベンチマークでは、StepFun-Proverは70.0%のpass @ 1成功率を達成します。ベンチマークパフォーマンスの向上を超えて、ツール統合推論モデルを開発するためのエンドツーエンドのトレーニングフレームワークを紹介し、自動クリーンアップ証明と数学AIアシスタントへの有望な方向性を提供します。