Takeaways: Nous présentons MMCRICBENCH-3K, un nouveau benchmark pour l'évaluation du raisonnement numérique et interlinguistique sur des images tabulaires semi-structurées. Nous révélons les limites des LVLM de pointe en matière de compréhension de textes visuels sensibles à la structure, de raisonnement numérique et de généralisation interlinguistique. Cet ensemble de données accessible au public facilite les recherches connexes.