En este artículo, presentamos VLMgineer, un marco para el codiseño iterativo de herramientas físicas y sus planes de actuación, aprovechando las capacidades de generación de código del Modelo de Lenguaje de Visión (VLM) y la exploración evolutiva. VLMgineer se evalúa en diversos puntos de referencia novedosos de escenarios de manipulación cotidianos que requieren el diseño y uso creativo de herramientas, y demostramos que descubre herramientas y políticas más efectivas e innovadoras que las herramientas creadas por humanos o los diseños generativos VLM dirigidos por humanos, transformando problemas robóticos complejos en ejecuciones sencillas. Planeamos publicar el punto de referencia y el código para futuras investigaciones en la invención de herramientas automatizadas.