Cet article propose FinS-Pilot, un nouveau benchmark pour l'évaluation des systèmes de génération augmentée de données (RAG) dans le secteur financier, qui nécessitent un traitement de données en temps réel et une précision experte. FinS-Pilot s'appuie sur des données d'interaction réelles avec des assistants financiers et intègre des données API en temps réel à des données textuelles pour construire un cadre de classification des intentions couvrant des domaines financiers critiques. Des expériences menées auprès de LLM chinois de premier plan démontrent l'efficacité de FinS-Pilot pour identifier des modèles adaptés aux applications financières, fournissant un cadre d'évaluation pratique et un ensemble de données affiné qui contribuent à l'avancement de la recherche sur les systèmes de traitement du langage naturel (TALN) en finance. Le code et l'ensemble de données sont disponibles sur GitHub.