Takeaways: Presentamos MMCRICBENCH-3K, un nuevo punto de referencia para evaluar el razonamiento numérico y multilingüe en imágenes tabulares semiestructuradas. Revelamos las limitaciones de los LVLM de vanguardia en la comprensión de textos visuales con estructura, el razonamiento numérico y la generalización multilingüe. Este conjunto de datos, disponible públicamente, facilita la investigación relacionada.